02 April 2016

技术方面

  • 基于朴素贝叶斯的定位算法 来自 阿里云 云栖社区
    • 描述如何收集标注数据,原来如此容易
    • 朴素贝叶斯简直是简单又神器的模型,这里一样考虑条件独立性假设和如何平滑待估计的参数。(当然,也可以用很多其他的机器学习方法来做)
    • 在拟合分布时为减少磁盘开销,就存分布的几个关键值即可;
    • 当计算是在全部网格中去判定时,计算效率肯定不高。这时可以先做粗判定,然后做细判定。
  • LBS定位技术 来自 阿里云 云栖社区
    • 这篇围绕GPS定位来介绍如何定位
    • 三角定位、为什么至少要4颗卫星、卫星数超过4颗时怎么办(最小二乘法)、为什么GPS第一次定位慢(这里受多普勒效应的影响使得搜星慢)
    • 除GPS定位之外,目前常使用的就是基于wifi或基站的定位
  • ODPS—MPI机器学习编程框架 来自 阿里云 云栖社区
    • 以batch gradient descent为例(文中用上了稍微复杂点的拟牛顿法L-BFGS)
    • 按样本、按特征做数据和模型上的切分,基于MPI接口来实现
    • 给出了ODPS中的类设计
  • 你刚才在淘宝上买了一件东西 来自 阿里云 云栖社区
    • 围绕“在淘宝上买了一件东西”一事,讲了相关的技术点
    • DNS域名解析、LVS、多域名下的并发加载资源、CDN、TFS、购物意图识别与检索结果返回、Tair、TimeTunnel、数据仓库、云梯。
  • 大数据处理漫谈 来自 阿里云 云栖社区
    • 大数据处理领域的技术变化很快,不断的有新的开源软件出现。作者在16年3月份梳理了当前的大数据处理领域的开源软件栈
    • 由4节组成,分为 典型架构、大数据软件栈、数据量与处理时间、场景
    • 通过这篇文章了解下技术点、名词还是不错的。
  • 深入FFM原理与实践
    • FM与FFM是最近几年很热的模型,在CTR预估的实际系统和比赛上都经常用到
    • 文章对FM、FFM及其应用做了一个总结,并介绍了一个开源工具的实现
    • 在360广告、美团广告都用了FM做CTR预估

地图匹配

行业观察


原创文章,转载请注明:转载自vividfree的博客

本文链接地址:201604 阅读笔记




blog comments powered by Disqus