欢迎您光临本小站。希望您在这里可以找到自己想要的信息。。。

 分类:编程内功

重要的产品分析模型:AARRR模型

重要的产品分析模型:AARRR模型
什么是AARRR模型? Acquisition:获取用户 Activation:提高活跃度 Retention:提高留存率 Revenue:获取收入 Refer:自传播 确切的说AARRR并不算是一种数据分析模型,而是一整套数据分析的思路,逻...

water 2周前 (10-21) 65℃ 0评论 1喜欢

10 大高性能开发宝石

10 大高性能开发宝石
我们循序渐进,从内存、磁盘I/O、网络I/O、CPU、缓存、架构、算法等多层次递进,串联起高性能开发十大必须掌握的核心技术。 - I/O优化:零拷贝技术- I/O优化:多路复用技术- 线程池技术- 无锁编程技术- 进程间通信技术- RPC && 序...

water 3周前 (10-09) 113℃ 0评论 1喜欢

Swagger介绍及使用

Swagger介绍及使用
相信无论是前端还是后端开发,都或多或少地被接口文档折磨过。前端经常抱怨后端给的接口文档与实际情况不一致。后端又觉得编写及维护接口文档会耗费不少精力,经常来不及更新。其实无论是前端调用后端,还是后端调用后端,都期望有一个好的接口文档。但是这个接口文档对于程序员来说,就跟注释一样,...

water 4个月前 (07-17) 296℃ 0评论 0喜欢

LRU与LFU比较

LRU与LFU比较
提到缓存,有两点是必须要考虑的:(1)缓存数据和目标数据的一致性问题。(2)缓存的过期策略(机制)。  其中,缓存的过期策略涉及淘汰算法。常用的淘汰算法有下面几种:(1)FIFO:First In First Out,先进先出(2)LRU:Least Recently U...

water 4个月前 (07-01) 636℃ 0评论 0喜欢

SRE 是什么,不是什么

SRE 是什么,不是什么
SRE,Site Reliability Engineering 的缩写。其中 site 是指 website,可以翻译为网站可靠性工程。这个工种是 Google 在 10 年前创造的,他们刚出了一本讲 SRE 的书,以下简称《SRE》。相应的,做这份工...

water 5个月前 (06-10) 333℃ 0评论 0喜欢

数据仓库之ETL实战

数据仓库之ETL实战
ETL,Extraction-Transformation-Loading的缩写,中文名称为数据抽取、转换和加载。 一般随着业务的发展扩张,产线也越来越多,产生的数据也越来越多,这些数据的收集方式、原始数据格式、数据量、存储要求、使用场景等方面有很大的差异。作为数据中心,既要保...

water 6个月前 (05-11) 324℃ 0评论 0喜欢

蘑菇街搜索与推荐架构,从 0 到 1 再到 100

蘑菇街搜索与推荐架构,从 0 到 1 再到 100
本文分享蘑菇街在搜索与推荐上踩过的坑,以及在探索路上的经验总结。从 0 到 1 再到 100,希望大家从中得到一些收获。 搜索架构的当前现状 蘑菇街搜索当前架构 蘑菇街当前搜索架构,分为在线和离线两部分。在线部分主要职责是处理在线的搜索请求。离线部分的主要职责...

water 9个月前 (02-04) 428℃ 0评论 1喜欢

电商推荐算法的三大维度:Match、Rank与Re-rank

电商推荐算法的三大维度:Match、Rank与Re-rank
电商环境下的个性化推荐,主要包含三大维度的模块,针对用户的候选召回(Match),候选商品的精排(Rank),以及线上的策略调控(Re-rank)。而Match(召回)和Rank(排序)是推荐流程非常关键的两步。 一、Match Match即有效和丰富的召回...

water 9个月前 (02-04) 898℃ 0评论 0喜欢

位图索引bitmap(三):位图索引技术集合FastBit

位图索引bitmap(三):位图索引技术集合FastBit
本节所介绍的FastBit是位图索引技术的集大成者,是一系列高级位图索引技术的集合,该项目最初设计目标是为美国国家高能物理实验提供支撑。 在FastBit中,两个核心创新点分别是: 字对齐混合压缩编码WAH,根据官方实验数据显示,其在高能物理实验中的索引性能是传统数据库...

water 11个月前 (12-11) 662℃ 0评论 0喜欢

不深入而浅出 Roaring Bitmaps 的基本原理

不深入而浅出 Roaring Bitmaps 的基本原理
0x00 前言 位图索引被广泛用于数据库和搜索引擎中,通过利用位级并行,它们可以显著加快查询速度。但是,位图索引会占用大量的内存,因此我们会更喜欢压缩位图索引。 Roaring Bitmaps 就是一种十分优秀的压缩位图索引,后文统称 RBM。 压缩位图索引有很多种...

water 11个月前 (12-11) 530℃ 0评论 1喜欢

深度剖析开源分布式监控CAT

深度剖析开源分布式监控CAT
CAT(Central Application Tracking)是一个实时和接近全量的监控系统,它侧重于对Java应用的监控,基本接入了美团上海侧所有核心应用。目前在中间件(MVC、RPC、数据库、缓存等)框架中得到广泛应用,为美团各业务线提供系统的性能指标、健康状况、监控告...

water 1年前 (2019-10-29) 519℃ 0评论 0喜欢

Devops

Devops
最近老是碰到这个名词,所以想了解一下这个到底是撒玩意? DevOps(Development和Operations的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。它是一种重视“软件开发人员(...

water 1年前 (2019-10-21) 607℃ 0评论 1喜欢

下一代的微服务架构基础是ServiceMesh?

下一代的微服务架构基础是ServiceMesh?
今年,ServiceMesh(服务网格) 概念在社区里头非常火,有人提出 2018 年是 ServiceMesh 年,还有人提出 ServiceMesh 是下一代的微服务架构基础。作为架构师,如果你现在还不了解 ServiceMesh 的话,是否感觉有点落伍了? 那么到底...

water 1年前 (2019-09-06) 658℃ 0评论 0喜欢

大数据文件格式揭秘:Parquet、Avro、ORC

大数据文件格式揭秘:Parquet、Avro、ORC
Parquet、Avro、ORC格式 相同点 基于Hadoop文件系统优化出的存储结构 提供高效的压缩 二进制存储格式 文件可分割,具有很强的伸缩性和并行处理能力 使用schema进行自我描述 属于线上格式,可以在Hadoop节点之间传递数据   不同点 ...

water 1年前 (2019-09-04) 1060℃ 0评论 0喜欢

什么样的大数据平台架构,才是最适合你的?

什么样的大数据平台架构,才是最适合你的?
技术最终为业务服务,没必要一定要追求先进性,各个企业应根据自己的实际情况去选择自己的技术路径。   它不一定具有通用性,但从一定程度讲,这个架构可能比BAT的架构更适应大多数企业的情况,毕竟,大多数企业,数据没到那个份上,也不可能完全自研,商业和开源的结合可能更好...

water 1年前 (2019-09-03) 802℃ 0评论 1喜欢

云计算和虚拟化

云计算和虚拟化
作者:Bright Liao链接:https://www.zhihu.com/question/35425470/answer/62993113来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 1. 基于虚拟机的虚拟化和基于容器的...

water 1年前 (2019-08-27) 659℃ 0评论 1喜欢

如何看待yandex开源clickhouse这个列式文档数据库?

如何看待yandex开源clickhouse这个列式文档数据库?
欧阳辰《Druid实时大数据分析》作者,”互联居”作者编辑推荐144 人赞同了该回答作者:欧阳辰链接:彪悍开源的分析数据库-ClickHouse – 互联居 – 知乎专栏来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商...

water 1年前 (2019-08-27) 1359℃ 0评论 0喜欢