欢迎您光临本小站。希望您在这里可以找到自己想要的信息。。。

water的文章

数据结构算法

自然语言处理命名实体识别(NER)

自然语言处理命名实体识别(NER)
NER(Named Entity Recognition,命名实体识别)又称作专名识别,是自然语言处理中常见的一项任务,使用的范围非常广。命名实体通常指的是文本中具有特别意义或者指代性非常强的实体,通常包括人名、地名、机构名、时间、专有名词等。NER系统就是从非结构化的文本中抽取...

2周前 (09-10) 42℃ 0评论 0喜欢

大数据云计算

Kafka Connect简介

Kafka Connect简介
Kafka 0.9+增加了一个新的特性Kafka Connect,可以更方便的创建和管理数据流管道。它为Kafka和其它系统创建规模可扩展的、可信赖的流数据提供了一个简单的模型,通过connectors可以将大数据从其它系统导入到Kafka中,也可以从Kafka中导出到其它系统。...

3周前 (09-06) 49℃ 0评论 0喜欢

Linux

Puppet、Chef、Ansible和SaltStack四大运维管理工具

Puppet、Chef、Ansible和SaltStack四大运维管理工具
虚拟化技术日益普及,基于行业标准的服务器功能越来越强大,加上云计算的出现,这些因素共同导致了企业内外需要加以管理的服务器数量大幅增长。过去我们只要管理内部数据中心里面的物理服务器机架,而现在我们要管理多得多的服务器,它们有可能遍布全球各地。   这时候,数据中心协调和配置管理工具...

1个月前 (08-16) 77℃ 0评论 0喜欢

java

Slf4j MDC实现原理分析

Slf4j MDC实现原理分析
MDC ( Mapped Diagnostic Contexts )  有了日志之后,我们就可以追踪各种线上问题。但是,在分布式系统中,各种无关日志穿行其中,导致我们可能无法直接定位整个操作流程。因此,我们可能需要对一个用户的操作流程进行归类标记,比如使用线程+时间戳,...

2个月前 (07-30) 99℃ 0评论 0喜欢

数据结构算法

标准化因子

标准化因子
1:标准化因子文件nrm 在讨论标准化因子(Normalization Factor)之前,首先应明晰两个概念: tf(term frequency):term在文档中出现的频次 idf(inverse doc frequency):包含term的词条越少,则此term的...

2个月前 (07-23) 86℃ 0评论 0喜欢

架构&设计模式

5分钟了解swagger

5分钟了解swagger
随着互联网技术的发展,现在的网站架构基本都由原来的后端渲染,变成了:前端渲染、先后端分离的形态,而且前端技术和后端技术在各自的道路上越走越远。 前端和后端的唯一联系,变成了API接口;API文档变成了前后端开发人员联系的纽带,变得越来越重要,swagger就是一款让你...

2个月前 (07-20) 122℃ 0评论 0喜欢

码农人生

万能的林萧说:我来告诉你,一个草根程序员如何进入BAT

万能的林萧说:我来告诉你,一个草根程序员如何进入BAT
引言   首先声明,不要再问LZ谁是林萧,林萧就是某著名程序员小说的主角名字。   写这篇文章的目的其实很简单,算是对之前LZ一篇文章的补充和完善。   之前LZ写过一篇《回答阿里社招面试如何准备,顺便谈谈对于Java程序猿学习当中各个阶段的建议》,那篇文章LZ主要介绍了如何应对...

2个月前 (07-17) 133℃ 0评论 0喜欢

java

JDK源码学习第一篇—-综述JDK类库分类

JDK源码学习第一篇—-综述JDK类库分类
借鉴参考文献中的分类从阅读JDK源码和理解JVM开始,本博客首先是自己学习过程的一个记录,写下自己的理解和心得,希望能坚持下去以期进阶;如果有读者赏光阅读,发现笔者的错误敬请不吝赐教,大家探讨共同进步。 第一类:精读源码   /*   &...

2个月前 (07-17) 113℃ 0评论 0喜欢

java

内存映射文件原理探索

内存映射文件原理探索
首先说说这篇文章要解决什么问题? 1.虚拟内存与内存映射文件的区别与联系. 2.内存映射文件的原理. 3.内存映射文件的效率. 4.传统IO和内存映射效率对比. 虚拟内存与内存映射文件的区别与联系  二者的联系 虚拟内存和内存映射文件都是...

3个月前 (07-05) 150℃ 0评论 0喜欢

架构&设计模式

git 添加 gitignore 规则无效

git 添加 gitignore 规则无效
正常情况 如果在项目开始的时候配置了.gitignore文件,对一些文件进行忽略。 进行版本控制的时候就会忽略对这些文件的跟踪,这是正常情况。 特殊情况 但是有一种情况是,项目开始的时候 没有将一些无关文件配置进 .gitignore里面。导致文件已经进行跟踪了,但是目...

3个月前 (06-29) 122℃ 0评论 0喜欢

java

ConcurrentHashMap使用要点

ConcurrentHashMap使用要点
ConcurrentHashMap的简要总结: 1、public V get(Object key)不涉及到锁,也就是说获得对象时没有使用锁; 2、put、remove方法要使用锁,但并不一定有锁争用,原因在于ConcurrentHashMap将缓存的变量分到多个Segment,...

3个月前 (06-14) 213℃ 0评论 0喜欢

Linux

关于linux下tmp文件夹

关于linux下tmp文件夹
关于linux下tmp文件夹,正如tmp temporary file 临时文件夹。   (1) 既然是临时文件夹,那么这个文件夹中的内容就会被清除,那么为什么我重新启动电脑之后,此文件夹中的内容还会存在呢?详细内容可以参考这篇文章http://www.ops...

4个月前 (06-08) 255℃ 0评论 0喜欢

架构&设计模式

Redis、SSDB、Memcache和MongoDB的区别

Redis、SSDB、Memcache和MongoDB的区别
摘要: Memcached可以利用多核优势,单实例吞吐量极高,可以达到几十万QPS(取决于key、value的字节大小以及服务器硬件性能,日常环境中QPS高峰大约在4-6w左右)。 1.Memcached Memcached的优点:Memcached可以利用多核优势,...

4个月前 (06-01) 253℃ 0评论 0喜欢

架构&设计模式

云搜索相关功能设置整理

云搜索相关功能设置整理
云搜索系统设置 1. 应用基本信息(名称、备注) 2. 数据存储量 (对应需要多少主分片) 3. 吞吐量tps (对应需要多少副本) 4. 数据源(topic、tag) 5. 定义应用结构(template) 6. 索引字段(倒排字段,用于query)及属性字段(正排字段用于过滤...

4个月前 (05-25) 206℃ 0评论 0喜欢