数据
对于化学家来说,人工智能革命尚未发生?
编辑 | 绿萝许多人担心 AI 已经走得太远,或者有走得太远的风险。拥有「AI 教父」之称的杰弗里·辛顿(Geoffrey Hinton)最近辞去了谷歌副总裁的职务,理由是希望不受约束地公开谈论 AI 对社会和人类福祉的潜在风险。但是,与这些大局的担忧相反,在许多科学领域,你会听到一种不同的沮丧情绪在悄悄地表达:AI 还没有走得足够远。其中一个领域是化学,机器学习工具有望在研究人员寻找和合成有用的新物质的方式上掀起一场革命。但大规模革命尚未发生——因为缺乏可用于「投喂」人工智能系统的数据。任何 AI 系统的好坏取决
为数据而生,为隐私而战:隐私计算产业加速崛起
在充分保护隐私的同时尽可能多地挖掘数据价值,不仅理论上可行,实践中也有越来越多的团队为之努力并取得进展。
“LLM”席卷大数据行业,独角兽Databricks收购以 AI 为中心的大数据平台Okera
由chat GPT带起的AI浪潮正在席卷全球,影响着所有的行业,也包括数据库领域。据TechCrunch报道,数据库领域独角兽Databricks 宣布收购了专注于 AI 的数据治理平台 Okera。虽然两家公司均未透露收购价格,从Crunchbase 的数据来看,Okera 此前筹集了近 3000 万美元,投资者包括 Felicis、Bessemer Venture Partners、Cyber Mentor Fund、ClearSky 和 Emergent Ventures。Databricks 在今天的公告中
世界首款真开源类ChatGPT大模型Dolly 2.0,可随意修改商用
众所周知,在 ChatGPT 的问题上 OpenAI 并不 Open,从 Meta 那里开源的羊驼系列模型也因为数据集等问题「仅限于学术研究类应用」,在人们还在因为寻找绕过限制方法的时候,主打 100% 开源的大模型来了。
聚焦数智化转型 百分点科技2023数据科学峰会即将举办
时代驱动数智化转型进入纵深阶段,数字经济高质量发展路径在潜移默化中演进而出。数据将变得更有用、更智慧、更具洞察力和前瞻性,在数据科学的推动下,组织将能够更充分地挖掘并释放数据价值。2023年,数据科学将会如何加速政府和企业数智化能力进阶?3月30日,百分点科技将于北京金隅智造工场科技秀场举办“2023数据科学峰会”, 此次大会以“数据·进阶”为主题,汇聚国内具有远见的专家学者和主流媒体等行业最强大脑,描绘新时代背景下的数据科学发展格局与趋势。联合全球权威咨询机构重磅发布首份数据能力进阶白皮书——《用数据创造价值以智
5分钟了解“内部威胁”,企业数据安全的定时炸弹
没有数据安全事件发生,不代表没有内部威胁,哪怕不做任何操作,起码做到心中有数,防患于未然。
金融行业数据分类分级“五步走”|盾见
文|查浩奇 《数据安全法》明确提出,国家要建立数据分类分级保护制度,根据数据在经济社会发展中的重要程度,以及一旦遭到篡改、破坏、泄露或者非法获取、非法利用,对国家安全、公共利益或者个人、组织合法权益造成的危害程度,对数据实行分类分级保护。国家数据安全工作协调机制统筹协调有关部门制定重要数据目录,加强对重要数据的保护。关系国家安全、国民经济命脉、重要民生、重大公共利益等数据属于国家核心数据,实行更加严格的管理制度。各地区、各部门应当按照数据分类分级保护制度,确定本地区、本部门以及相关行业、领域的重要数据具体目录,对列
开源三套数据集、牵头团体行业标准,腾讯音乐天琴实验室引领音视频技术创新和发展
3月13日,腾讯音乐天琴实验室联合清华大学人机语音交互实验室(THUHCSI)、音频语音与语言处理研究组(ASLP@NPU)、CCF计算艺术分会及北京市智慧广电(网络视听)重点实验室四家机构共同发布三套开源数据集,该项目在中国音像与数字出版协会数字音乐工作委员会(“中国音数协数字音乐工委”)的指导下,面向行业、高校专业研究人员提供数据开放服务,夯实产业发展基础,为数字音乐产业升级注入新活力。此前,在中国音数协数字音乐工委指导下,腾讯音乐牵头制定了两项团体标准,打开行业规范化发展新格局。天琴实验室发布三套开源数据集,
AI知道你脑子里在想什么,还帮你画了出来,项目代码已开源
一个「所见即所思」的世界将是什么样子?
PPC Insights系列:洞见安全多方图联邦
知识图谱(Knowledge Graph)技术凭借其拓扑结构的信息关联关系和消息传递机制,能够对单体信息进行有益补充,因此正在被逐步应用于金融反欺诈、反洗钱和精准营销等场景。但是,因为现实社会中的数据孤岛问题,单一机构内的图数据往往只是一小部分,导致了更全面的关联关系和消息传递范式被阻断,这使得图数据的现实应用价值大打折扣。为此,洞见科技自主研发了“安全多方图联邦(Insight Federated Graph,InsightFG)”技术,并获得了国家发明专利。该技术从能力上涵盖了多方图数据的安全构建、安全查询、安
恺望数据发布自动化数据产线,称「95%以上自动驾驶数据仍需人工标注」
GhatGPT的爆火带给了全世界一个热点问题:「人工智能真的能替代人力吗?」在目前仍依靠规模人力方式的数据标注领域,自动驾驶数据服务公司恺望数据给出了一个双面答案——「能,但还不完全能替代。」2月17日,一场聚集了自动驾驶圈内技术专家、汽车自动驾驶及智能网联领域投资人参加的闭门交流会在北京举行。会上恺望数据透露,基于「自动化产线 规模化人力」为核心的「恺望自动化数据产线」已经启用。据透露,该自动化数据产线以数字驱动方式打造自动驾驶数据生产的全流程系统,并充分考虑「人机交互」的适配场景,通过SaaS平台、算法、各板块
蚂蚁集团被独立研究机构列入《2023Q1亚太企业反欺诈市场格局》第一梯队
近日, 国际权威研究机构Forrester发布《 2023年第一季度亚太企业欺诈管理格局报告》(The Enterprise Fraud Management Landscape In Asia Pacific, Q1 2023),蚂蚁集团被列入第一梯队,即近一年收入规模超3000万美金的厂商。本次报告通过地理重点、行业重点和产品类型等维度概述了亚太地区24家反欺诈供应商的能力,并以收入规模为指标划分供应商梯队。《报告》认为,在亚太地区高度的数字化渗透率和经济逆风助推下,经受骗者授权的支付欺诈和政策滥用欺诈等新型欺
中文语法纠错全国大赛获奖分享:基于多轮机制的中文语法纠错
分享了 在CCL汉语学习者中文语法纠错任务赛道二的亚军方案,重点介绍“基于多轮机制的中文语法纠错任务”。
Lidar 3D传感器点云数据与2D图像数据的融合标注
2D&3D融合以自动驾驶场景为例,自动驾驶汽车需要使用传感器来识别车辆周围的物理环境,用来捕获2D视觉数据,同时在车辆顶部安装雷达,用以捕捉精确目标定位的3D位置数据。激光雷达生成的点云数据可用于测量物体的形状和轮廓,估算周围物体的位置和速度,但点云数据缺少了RGB图像数据中对物体纹理和颜色等信息的提取,无法精确地将对象分类为汽车、行人、障碍物、信号灯等。所以需要将包括丰富的语义信息2D视觉图像和可以提供精确的目标定位3D点云数据进行融合,使自动驾驶系统能够精确地了解周围环境,准确做出判断,让自动驾驶功能得以广泛应
如何实现数据高效管理并反哺赋能业务?这场自动驾驶闭门会要聊点实的
随着自动驾驶向着高阶迭代,汽车的定位由交通工具转向“智能移动终端 第三空间”,车企及自动驾驶企业的核心竞争力转向软件及服务能力。伴随汽车数智升级而来的是数据体量和算力需求的指数级增长,要真正应对智能网联趋势下的技术瓶颈和业务赋能挑战,建立一套贯穿数据应用和管理全流程的有机数据闭环,在汽车全生命周期内最大程度挖掘数据价值至关重要。为快速打造基础设施、打通数据闭环,车企纷纷开启上云进程。在后续汽车数智化军备竞赛中,如何高效完成数据从工具到核心资产、数据应用管理从基础能力进阶竞争壁垒的转变,并实现降本增效,云服务能力
一种多用途深度学习方法,用于CITE-seq和单细胞RNA-seq数据与细胞表面蛋白预测和插补的集成
编辑 | 萝卜皮CITE-seq 是一种单细胞多组学技术,可同时测量单细胞中 RNA 和蛋白质的表达,已广泛应用于生物医学研究,特别是免疫相关疾病和其他疾病,如流感和 COVID-19。尽管 CITE-seq 激增,但生成此类数据的成本仍然很高。尽管数据集成可以增加信息内容,但这带来了计算挑战。首先,组合多个数据集容易产生需要解决的批处理效应。其次,很难组合多个 CITE-seq 数据集,因为不同数据集中的蛋白质面板可能仅部分重叠。整合多个 CITE-seq 和单细胞 RNA 测序 (scRNA-seq) 数据集很
ECCV 2022 | 赵天成博士OmLab团队斩获ODinW开放域目标检测双料冠军等多项荣誉并受邀进行主题报告
日前,浙江大学滨江研究院Om人工智能研究中心主任、联汇科技首席科学家赵天成博士团队 OmLab 在国际顶会ECCV 2022 ODinW 挑战赛中获得 Full-Shot(全量数据学习)赛道与Few-Shot(小样本数据学习)赛道双料冠军、在 Zero-Shot 赛道获得第四排名的佳绩。基于全新目标检测框架 OmDet 的先进性和创新价值,赵天成博士受邀发表主题报告演讲。ECCV(European Conference on Computer Vision,欧洲计算机视觉国际会议)是计算机视觉方向的世界范围三大顶级
中科院图协作学习模型,从空间分辨转录组学数据中阐明肿瘤异质性
编辑 | 萝卜皮空间解析转录组学 (SRT) 技术使研究人员能够获得对组织结构和细胞发育的新见解,尤其是在肿瘤中。然而,缺乏对生物背景和多视图特征的计算开发严重阻碍了组织异质性的阐明。在这里,中国科学院的研究团队提出了 stMVC,这是一种多视图图协作学习模型,它在通过注意力分析 SRT 数据时集成了组织学、基因表达、空间位置和生物学背景。具体来说,采用半监督图注意力自动编码器的 stMVC 分别学习组织学相似性图或空间位置图的特定视图表示,然后在生物上下文的半监督下通过注意力同时整合两个视图图以获得鲁棒表示。st