前阵子老板安排了一个新任务,要建设一个商家商品搜索系统,能够为用户提供快速、准确的搜索能力,在用户输入搜索内容时,要能从商家名称和商品名称两个维度去搜索,搜索出来的结果,按照准确率排序,并按商家所属商品的关联关系,来组合数据结构,同时提供API给业务系统调用。
背景很简单,...
4年前 (2020-03-21) 908℃
0喜欢
总 第22篇
2020年 第01篇
导读
Azkaban是LinkedIn公司于2012年开源的“工作流调度”引擎, 与之类似的有「Oozie」, 「Airflow」,「DolphinScheduler」等工作流调度系统。
...
4年前 (2020-02-02) 1519℃
1喜欢
本文选自“字节跳动基础架构实践”系列文章。
“字节跳动基础架构实践”系列文章是由字节跳动基础架构部门各技术团队及专家倾力打造的技术干货内容,和大家分享团队在基础架构发展和演进过程中的实践经验与教训,与各位技术同学一起交流成长。
作为目前字节...
4年前 (2020-01-02) 917℃
0喜欢
近年来,随着IT技术与大数据、机器学习、算法方向的不断发展,越来越多的企业都意识到了数据存在的价值,将数据作为自身宝贵的资产进行管理,利用大数据和机器学习能力去挖掘、识别、利用数据资产。如果缺乏有效的数据整体架构设计或者部分能力缺失,会导致业务层难以直接利用大数据大数据,...
4年前 (2019-12-29) 773℃
0喜欢
点击上方“大数据与人工智能”,“星标或置顶公众号”
第一时间获取好内容
为什么考察SQL?
大数据分析工程师80%的时间都在与SQL打交道,通过SQL完成业务方的各种临时性需求分析和常规性报表统计。熟练的SQL技能能够大大提高工作效率。本...
4年前 (2019-08-13) 1150℃
0喜欢
Hive起源于Facebook,是基于 Hadoop HDFS 分布式文件系统的分布式 数据仓库 架构。它为数据仓库的管理提供了许多功能:数据ETL(抽取、转换和加载)工具、数据存储管理和大型数据集的查询和分析能力。同时Hive还定义了类SQL的语言(HiveQL)。...
4年前 (2019-07-15) 1037℃
0喜欢
也可以到我个人博客阅读(点击下面阅读原文即可) https://www.iteblog.com/archives/2557.html
Uber 致力于在全球市场上提供更安全,更可靠的运输服务。为了实现这一目标,Uber 在很大程度上依赖于数据驱动的决策,从预测高...
4年前 (2019-07-15) 886℃
0喜欢
两天前7月12号,我对外正式宣布TDengine, 一款专为物联网定制打造的大数据平台软件,正式开源,将我和涛思数据团队两年多的时间写下的10多万行C语言代码放在GitHuB上,分享给全球的开发者。
开源的代码里,有我自己亲手写的3万多行C代码,包括...
4年前 (2019-07-15) 1012℃
1喜欢
导语
通过前面12篇文章的学习,相信大家对于数据分析工作中所有可能用到的基础技能点有了一个较全面的了解。
日常工作中,需求一般分两种,一种是临时需求,比如为了评估某个特定功能的统计,可以理解为一次性...
4年前 (2019-07-15) 1935℃
0喜欢
阿里妹导读:互联网的飞速发展促进了很多新媒体的发展,不论是知名的大V,明星还是围观群众都可以通过手机在微博、朋友圈或者点评网站上发表动态,分享自己的所见所想,使得“人人都有了麦克风”。不论是热点新闻还是娱乐八卦,传播速度远超我们的想象,一则信息可以在短短数分钟...
4年前 (2019-07-15) 908℃
0喜欢