欢迎来到无限飞翔,在这里,你会找到许多有趣的技术 : )

标签:数据

开发者头条

如何防止数据重复插入?

如何防止数据重复插入?
号外:为读者持续整理了几份最新教程,覆盖了 Spring Boot、Spring Cloud、微服务架构等PDF。 获取方式:关注右侧公众号”泥瓦匠BYSocket”,来领取吧! 摘要: 原创出处 https://www.bysocke...

7个月前 (04-21) 355℃ 0喜欢

开发者头条

中华万年历头条数据聚合优化实践(2017)

中华万年历头条数据聚合优化实践(2017)
业务介绍 中华万年历的头条数据是根据推荐算法聚合而成的数据,包括ALS算法数据、用户画像数据、时效数据、非时效数据、定投数据、惊喜数据、频道数据、热榜数据、用户相关阅读推荐数据等。启动方式分为冷启动和用户画像启动。 冷启动:无用户画像或用户画像得分<8分...

7个月前 (04-21) 243℃ 0喜欢

开发者头条

我也聊聊数据与磁盘 IO

我也聊聊数据与磁盘 IO
作者「陈龙」| 基础研发平台 – IoT中心 小编「西顿」| 人力资源中心 Figure 1 说到磁盘,我们大多数人脑海里都能想到磁盘的物理模型(Figure ...

7个月前 (04-21) 342℃ 0喜欢

开发者头条

如何将 PDF 表格数据免费转换到 Excel?

如何将 PDF 表格数据免费转换到 Excel?
所见即所获,提升你的数据采集效率。 需求 写了那篇《如何用Python批量提取PDF文本内容?》后,我在后台收到了许多留言。 不少读者询问,如果是 PDF 文件中的表格呢?能否正确转换? 我当时没有理解这种需求。因为那篇文章谈...

7个月前 (04-08) 270℃ 0喜欢

开发者头条

数据从网卡到应用程序的过程

数据从网卡到应用程序的过程
最近看的《网络是怎样连接的》非常有趣,真的是 “计算机网络概论” 图解趣味版。 本文写写数据从网卡到应用的过程,内容与图片很多整理自《网络是怎样连接的》、《Tomcat内核设计与剖析》,有的图片因清晰度不够我进行了重绘。 总览 ...

7个月前 (04-08) 550℃ 2喜欢

开发者头条

中文公开聊天语料库

中文公开聊天语料库
readme.md 说明 该库是对目前市面上已有的开源中文聊天语料的搜集和系统化整理工作 该库搜集了包含 chatterbot 豆瓣多轮 PTT八卦语料 ...

8个月前 (03-26) 346℃ 0喜欢

开发者头条

数据被污染很可怕?看看蚂蚁金服的数据治理之道

数据被污染很可怕?看看蚂蚁金服的数据治理之道
今年年初,蚂蚁金服ATEC城市峰会在上海举办。金融智能专场分论坛上,蚂蚁金服数据平台部高级数据技术专家李俊华做了主题为《蚂蚁金服数据治理之数据质量治理实践》的精彩分享。 演讲中,李俊华介绍了蚂蚁金服数据架构体系的免疫系统——数据质量治理体系,此外还着重介绍了数...

8个月前 (03-12) 355℃ 0喜欢