`
BradyZhu
  • 浏览: 249138 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论
文章列表
作者:寒小阳 && 龙心尘 时间:2015年12月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/50178505 声明:版权所有,转载请联系作者并注明出处 1. 引言 上一节深度学习与计算机视觉系列(3)_线性SVM与SoftMax分类器中提到 ...
咚咚是什么?咚咚之于京东相当于旺旺之于淘宝,它们都是服务于买家和卖家的沟通。 自从京东开始为第三方卖家提供入驻平台服务后,咚咚也就随之诞生了。 我们首先看看它诞生之初是什么样的。 1.0 诞生(2010 - 2011) 为了 ...
最近着手处理大批量数据的任务。从文本文件中导入数据。到搜索服务器存储。 为了提升性能,用的java并发包中的阻塞双端队列LinkedBlockingDeque。 生产者线程 读取数据。 消费者 从队列中取出数据 提交到搜索引擎 package com.lubanec.cache.model; import java.util.concurrent.LinkedBlockingDeque; import java.util.concurrent.TimeUnit; import java.util.concurrent.atomic.AtomicInteger; import org. ...
最近读到一篇文章「电竞选手Sky:站上膨胀的金字塔」 颇有感触,与早年这个行业的寒碜相比,如今巨额资本涌入建立起了完整的电竞生态圈。 除了职业选手还有俱乐部、协会、内容制作方、游戏开发方、赞助方、直播平台、主播、周边店铺、解说,甚至投注网站, 一个完整的行业生态链已经建立,提供了大量的岗位,充斥着形形色色的不同人群。 Sky 是这个行业最早的一批职业选手,经历了行业从 0 到 1,又从 1 爆发到如今后面跟着 N 个 0 的局面。 不过本文不写 Sky,只是因上面这篇文章引发一些旧时的回忆,写个身边跟电竞有过点交叉的程序员。 他是一个很早的朋友了,那时我们爱一起玩游戏,大概 95 年左右 ...
作者: 龙心尘&&寒小阳 时间:2015年11月。 出处:http://blog.csdn.net/longxinchen_ml/article/details/50082873, http://blog.csdn.net/han_xiaoyang/article/details/50100367 声明:版权所有,转载请联系作者并注明出处,谢谢。 1.开场先扔个段子 在互联网广告营销中,经常会有这样的对话: 问:你们的人群标签是什么样的? 答:我们是专门为您订制的look-alike标签! 问:好吧,你们的定向算法能不能说明一下? ...
问题:zookeeper 作用? 答:最重要的是保证分布式的数据的一致性 解决了单点故障 问题:zookeeper写的过程? 把任务tesk 通过 提交给client,client把tesk提交给连接的server,server在提交给leaderserver。。把任务提交给队列。然后 ...
作者: 寒小阳 &&龙心尘 时间:2015年11月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/49999299 声明:版权所有,转载请注明出处,谢谢。 1. 线性分类器 在深度学习与计算机视觉系列(2)我们提到了图像识别的问题,同时提出了一种简单的解决方法——KNN。然后我们也看到了KNN在解决这个问题的时候,虽然实现起来非常简单,但是有很大的弊端: 分类器必须记住全部的训练数据(因为要遍历找近邻啊!!),而在任何实际的图像训练集上,数据量很可能非常大,那么一次性载入内存,不管是速度还是对硬件 ...
作者: 寒小阳 &&龙心尘 时间:2015年11月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/49949535 声明:版权所有,转载请注明出处,谢谢 1. 图像分类问题 这是很久以前就引起关注的一类图像相关问题。 对于一张输入 ...
作者: 寒小阳 &&龙心尘 时间:2015年11月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/49876119 声明:版权所有,转载请注明出处,谢谢。 1.背景 计算机视觉/computer vision是一个火了N年的topic。持续化升温的原因也非常简单:在搜索/影像内容理解/医学应用/地图识别等等领域应用太多,大家都有一个愿景『让计算机能够像人一样去”看”一张图片,甚至”读懂”一张图片』。 有几个比较重要的计算机视觉任务,比如图片的分类,物体识别,物体定位于检测等等。而近年来的神经网络/深度 ...
ZooKeeper进行访问,数据创建,数据修改等操作. 使用 zkCli.sh -server 127.0.0.1:2181 连接到 ZooKeeper 服务,连接成功后,系统会输出 ZooKeeper 的相关环境以及配置信息。 命令行工具的一些简单操作如下: 1. 显示根目录下、文件: ls / 使用 ls 命令来查看当前 ZooKeeper 中所包含的内容 2. 显示根目录下、文件: ls2 / 查看当前节点数据并能看到更新次数等数据 3. 创建文件,并设置初始内容: create /zk "test" 创建一个新的 znode节点“ zk ”以及与它关联的 ...
一:相似度算法 lucene采用的是基于VSM(向量空间模型)的相似度算法, 查询向量(query vector)与搜索出来的文档向量(document vector) 形成N个夹角,计算q 和d 之间的夹角,最小的 就是相 似度最高的。 二:lucene的打分公式 看下lucene的打分公式: tf: 一个term在一个文档中出现的次数 idf:一个term在多少个文档中出现过 t.getBoost:lucene自有的权重配置,默认为1 norm:字段标准化。 在Lucene中score简单说是由 tf * idf * boost * norm 计算得出的。 ...
作者: 寒小阳 &&龙心尘 时间:2015年11月。 出处:http://blog.csdn.net/han_xiaoyang/article/details/49797143 声明:版权所有,转载请注明出处,谢谢。 1.引言 先说一句,年末双十一什么的一来,真是非(mang)常(cheng)欢(gou)乐(le)! ...
又到双十一了,这已经是我到京东后第五个双十一了,如今双十一已经发展成了一个全民的购物狂欢节。 2011 年,是我在京东经历的第一个双十一。那时京东刚刚拓展了图书品类,就搞了一个三小时内下单图书满两百减一百的活动。也正是这个活动刺激了广大爱学习、爱读书的同学疯狂下单,最后订单系统瘫痪了。正是这次瘫痪引发了后面老刘插刀请技术部负责人喝茶的轶事。 那时作为一名正在快速成长的程序员,我自然也买了很多书,为这次系统瘫痪贡献了一份力量:)。今天整理办公桌抽屉,发现一本隐藏在最里面角落的旧书,正是在那次活动上满两百减一百买的。真可惜这本书一直藏身暗室不见天日,一晃好几年过去了,如今也兴不起阅读的兴趣 ...
计划的由来 我们是一群对机器学习感兴趣的小伙伴,对于神奇的机器学习经常有“一探究竟”的冲动,却因为孤身一人学习的寂寞、亦或繁忙考试工作之余的小小拖延症,而没有持续这份对知识的渴求和热情。 由于深感类似 ...
计划的由来 我们是一群对机器学习感兴趣的小伙伴,对于神奇的机器学习经常有“一探究竟”的冲动,却因为孤身一人学习的寂寞、亦或繁忙考试工作之余的小小拖延症,而没有持续这份对知识的渴求和热情。 由于深感类似 ...
Global site tag (gtag.js) - Google Analytics