数据
百分点认知智能实验室:基于不完全标注样本集的信息抽取实践
编者按信息抽取是从文本数据中抽取特定信息的一种技术,命名实体识别(Named Entity Recognition, NER)是信息抽取的基础任务之一,其目标是抽取文本中具有基本语义的实体单元,在知识图谱构建、信息抽取、信息检索、机器翻译、智能问答等系统中都有广泛应用。基于监督学习的NER系统通常需要大规模的细粒度、高精度标注数据集,一旦数据标注质量下降,模型的表现也会急剧下降。利用不完全标注的数据进行NER系统的建立,越来越受到专家学者们的关注。第九届国际自然语言处理与中文计算会议(NLPCC 2020)针对此业
百分点科技:媒体数据中台建设方法论和落地实践
编者按媒体融合下半场的重心将向智能化趋势发展。如何打造实用有效的媒体数据产品和服务,继而完成数智化转型,已成为媒体行业当前最为关注的问题。本文围绕当前媒体机构的转型需求,百分点科技大数据技术团队系统地介绍了百分点科技媒体数据中台建设方法论及实践成果。一、媒体数据中台建设背景以报纸、出版、广播电视等为代表的传统媒体,和以网站、新闻客户端、微博、微信公众号、IPTV、OTT等为代表的新媒体产品,无论是呈现方式、传播途径,还是建设目标、技术体系都大不相同,这就导致了系统建设重复浪费、各应用系统和发布渠道各自为政,出现业务
百分点大数据技术团队:数据治理“PAI”实施方法论
编者按数据作为第五大生产要素,已逐渐成为政府和企业决策的重要手段与依据。面对数据多样化、数据需求个性化、数据应用智能化的需求,以及在2B和2G行业中数据质量参差不齐、数据应用难以发挥价值、数据资产难以沉淀等问题,如何做好数据治理工作、提升数据治理能力成为了政府和企业数字化转型的重中之重。百分点大数据技术团队基于多年的数据治理项目经验,总结了一套做好数据治理工作及提升数据治理能力的实施方法论。近年来,推动数据治理体系建设一直是业界探索的热点,另外,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》将数
抓取了1400家科技公司的招聘信息,我发现数据工程师比数据科学家更有市场
「作为数据科学家,我还有机会吗?」不,你更应该成为数据工程师。