技术方面
- 基于朴素贝叶斯的定位算法 来自 阿里云 云栖社区
- 描述如何收集标注数据,原来如此容易
- 朴素贝叶斯简直是简单又神器的模型,这里一样考虑条件独立性假设和如何平滑待估计的参数。(当然,也可以用很多其他的机器学习方法来做)
- 在拟合分布时为减少磁盘开销,就存分布的几个关键值即可;
- 当计算是在全部网格中去判定时,计算效率肯定不高。这时可以先做粗判定,然后做细判定。
- LBS定位技术 来自 阿里云 云栖社区
- 这篇围绕GPS定位来介绍如何定位
- 三角定位、为什么至少要4颗卫星、卫星数超过4颗时怎么办(最小二乘法)、为什么GPS第一次定位慢(这里受多普勒效应的影响使得搜星慢)
- 除GPS定位之外,目前常使用的就是基于wifi或基站的定位
- ODPS—MPI机器学习编程框架 来自 阿里云 云栖社区
- 以batch gradient descent为例(文中用上了稍微复杂点的拟牛顿法L-BFGS)
- 按样本、按特征做数据和模型上的切分,基于MPI接口来实现
- 给出了ODPS中的类设计
- 你刚才在淘宝上买了一件东西 来自 阿里云 云栖社区
- 围绕“在淘宝上买了一件东西”一事,讲了相关的技术点
- DNS域名解析、LVS、多域名下的并发加载资源、CDN、TFS、购物意图识别与检索结果返回、Tair、TimeTunnel、数据仓库、云梯。
- 大数据处理漫谈 来自 阿里云 云栖社区
- 大数据处理领域的技术变化很快,不断的有新的开源软件出现。作者在16年3月份梳理了当前的大数据处理领域的开源软件栈
- 由4节组成,分为 典型架构、大数据软件栈、数据量与处理时间、场景
- 通过这篇文章了解下技术点、名词还是不错的。
- 深入FFM原理与实践
- FM与FFM是最近几年很热的模型,在CTR预估的实际系统和比赛上都经常用到
- 文章对FM、FFM及其应用做了一个总结,并介绍了一个开源工具的实现
- 在360广告、美团广告都用了FM做CTR预估
地图匹配
- 地图匹配实践 来自 阿里云 云栖社区
- GeoHash核心原理解析 来自 阿里云 云栖社区
- 深入浅出空间索引:为什么需要空间索引 来自 阿里云 云栖社区
- 地理围栏算法解析 来自 阿里云 云栖社区
行业观察
- 关于 金融数据服务提供商 Kensho
原创文章,转载请注明:转载自vividfree的博客
本文链接地址:201604 阅读笔记