数据

哈工大与腾讯团队合作开发：一种专门针对蛋白质组数据设计的深度学习反卷积格式
编辑 | 萝卜皮细胞典型反卷积是一种用于从洪量测序数据中确定/解析细胞典型比例的计算格式，并且经常用于剖析肿瘤构造样本中的不同细胞典型。然而，由于重复性/再现性、参照标准可变以及缺乏单细胞蛋白质组参照数据的应战，使用蛋白质组数据剖析细胞典型的反卷积技巧仍处于起步阶段。哈尔滨工业大学、腾讯 AI lab 以及苏黎世联邦理工学院的研讨团队合作开发了一种专门针对蛋白质组数据设计的鉴于深度学习的反卷积格式…
理论
- 10
- 0
ScienceAI23年10月24日
1句指令+5美元+20分钟，就能训练出小型专业模型，Prompt2Model了解一下
大规模语言模型（LLM）运用户可以借助提醒和上下文学习来建立强大的自然语言解决体系。然而，从另一角度来看，LLM 在一定自然语言解决工作上表现存在一定退步：这些模型的布置需要大量计算资源，并且通过 API 与模型举行交互可能引发潜在的隐私问题。为了应对这些问题，来自卡内基梅隆大学（CMU）和清华大学的研究人员，共同推出了 Prompt2Model 框架。该框架的目标是将基于 LLM 的数据生成和检…
AI
- 9
- 0
机器之心23年8月31日
3000多条数据里选出200条效果反而更好，MiniGPT-4被配置相同的模型超越了
今年四月诞生的多模态大型说话模型 MiniGPT-4 不仅能看图聊天，还能利用手绘草图建网站，可以说是功能强大。而在预训练之后的微调阶段，该模型利用了 3000 多个数据。确实很少，但上海交通大学清源研讨院和里海大学的一个联合研讨团队认为还可以更少，因为这些数据中大部分品质都不高。他们设计了一个数据选择器，从中选出了 200 个数据，然后训练获得了 InstructionGPT-4 模型，其表现竟…
AI
- 15
- 0
机器之心23年8月29日
展望热门歌曲成功率 97%？这份清单前来「打假」
单看数据结果是不够的，要仔细判断这些数据的可靠性。
AI
- 4
- 0
机器之心23年8月21日
OpenAI公布「官方爬虫」：GPT-5靠它训练，有需求可以屏蔽
众所周知，OpenAI 从 GPT-4 开始就已经对技术细节完全保密了，最初只用一份 Tech Report 来展示基准测试结果，而闭口不谈训练数据和模型参数。尽管后来有网友各种爆料，OpenAI 也从未回应。
AI
- 7
- 0
机器之心23年8月8日
企业数据，大言语模型和矢量数据库
随着 ChatGPT 的推出，通用人工智能的时代缓缓拉开序幕。我们第一次看到市场在追求人工智能开发者，而不是以往的开发者寻找市场。
AI
- 5
- 0
机器之心23年8月1日
分析过688篇大模型论文，这篇论文综述了LLM的当前挑拨和运用
LLM 面临哪些挑拨又有哪些运用？系统性的综述论文来了。
AI
- 13
- 0
机器之心23年7月31日
大模型与常识图谱融合？爱数推出鉴于大模型的范围认知智能产物与方案
大模型的影响力正在深入各行业，对各厂商而言，既是机遇也是挑战。2023年世界人工智能大会期间，超过30家大模型厂商在上海亮相，有人在大炼模型，也有人迅速找到场景落地，事实上在大模型出现之前就已经有一些天然的场景需求。在数据总量越来越大的今天，数据存储、数据管制、数据xx的重要性正在B端企业凸显。换句话说数据已经成为企业的有形资产，数据处置正在成为新经济增长的重要方向之一。越来越多数据厂商正在思考—…
AI
- 7
- 0
机器之心23年7月18日
获星1.9k，LLM微调神器Lamini上演速度与激情，收费可用
LLM 微调不再头疼。
AI
- 6
- 0
机器之心23年7月16日
单细胞生物学根底大型语言模型scGPT革新版来了，在超3300万个细胞上举行预训练
编辑 | 紫罗就在前不久，多伦多大学钻研团队颁布首个单细胞生物学根底大型语言模型：scGPT，其在超 1000 万个细胞上举行预训练。现在，该钻研团队首次尝试对超过 3300 万个细胞举行生成预训练来革新 scGPT。论文的通讯作者、多伦多大学助理教授 Bo Wang 在推特激动发文：「令人兴奋的 scGPT 革新：自 4 月份颁布以来，受到社区的极大关注，我们很高兴地宣布单细胞多组学数据的根底模…
AI
- 40
- 0
ScienceAI23年7月5日
大语言模型做数据助手，浙大Data-Copilot高效挪用、处置惩罚、可视化数据
Data-Copilo：大型语言模型，做你最贴心省事的数据助手。
AI
- 31
- 0
机器之心23年6月26日
想给营业松松绑，又怕数据泄漏隐患? 动向脱敏了解一下！
极盾·觅踪的数据动向脱敏系统提供脱敏前的计谋剖析决策、脱敏实施中的天真配置脱敏规则和脱敏后的持续经营调优，形成一套完整的脱敏经营体系。
AI
- 12
- 0
极盾科技23年6月25日
电信及互联网行业数据平安内控审计建设实践 | 盾见
一站式解决数据平安合规审计、利用过程平安监测、动向脱敏防备等问题，为电信及互联网企业数字化建设保驾护航。
AI
- 8
- 0
极盾科技23年6月2日
5 个章节、25 条规范，全方位 Get 数据集采用与创办的「百科全书」
内容一览：如果你正在进修如何创办或采用一个合适的数据集，那么这篇文章会给你一些实用的建议，帮助你在采用和创办数据集时做出明智的决策。关键词：机械进修数据集
AI
- 7
- 0
HyperAI超神经23年6月2日
对于化学家来说，人工智能革命尚未发生？
编辑 | 绿萝许多人担心 AI 已经走得太远，或者有走得太远的风险。具有「AI 教父」之称的杰弗里·辛顿（Geoffrey Hinton）最近辞去了谷歌副总裁的职务，理由是希望不受约束地公开谈论 AI 对社会和人类福祉的潜在风险。但是，与这些大局的担忧相反，在许多科学领域，你会听到一种不同的沮丧情绪在悄悄地表达：AI 还没有走得充足远。其中一个领域是化学，机器学习东西有望在研讨职员寻找和合成有用的…
AI
- 9
- 0
ScienceAI23年5月18日
为数据而生，为隐衷而战：隐衷计较产业加速崛起
在充分伤害隐衷的同时尽可能多地挖掘数据价值，不仅理论上可行，实践中也有越来越多的团队为之努力并取得进展。
AI
- 10
- 0
机器之心23年5月15日
“LLM”席卷大数据行业，独角兽Databricks收买以 AI 为中心的大数据平台Okera
由chat GPT带起的AI浪潮正在席卷全球，影响着所有的行业，也包括数据库领域。据TechCrunch报道，数据库领域独角兽Databricks 宣布收买了专注于 AI 的数据管理平台 Okera。虽然两家公司均未透露收买价格，从Crunchbase 的数据来看，Okera 此前筹集了近 3000 万美元，投资者包括 Felicis、Bessemer Venture Partners、Cyber…
AI
- 32
- 0
新闻助手23年5月5日
世界首款真开源类ChatGPT大模型Dolly 2.0，可随意修改商用
众所周知，在 ChatGPT 的问题上 OpenAI 并不 Open，从 Meta 那里开源的羊驼系列模型也因为数据集等问题「仅限于学术研究类利用」，在人们还在因为寻找绕过限制方法的时候，主打 100% 开源的大模型来了。
AI
- 11
- 0
机器之心23年4月13日
聚焦数智化转型百分点科技2023数据迷信峰会即将举办
期间驱动数智化转型进入纵深阶段，数字经济高质量倒退路径在潜移默化中演进而出。数据将变得更有用、更聪慧、更具洞察力和前瞻性，在数据迷信的推动下，组织将能够更充分地挖掘并释放数据代价。2023年，数据迷信将会如何加快政府和企业数智化能力进阶？3月30日，百分点科技将于北京金隅智造工场科技秀场举办“2023数据迷信峰会”，此次大会以“数据·进阶”为主题，会聚国内具有远见的专家学者和主流媒体等行业最强大…
AI
- 11
- 0
新闻助手23年3月27日
5分钟了解“外部威逼”，企业数据保险平安的定时炸弹
没有数据保险平安事件发生，不代表没有外部威逼，哪怕不做任何操纵，起码做到心中有数，防患于未然。
AI
- 8
- 0
极盾科技23年3月23日
金融行业数据分类分级“五步走”|盾见
文|查浩奇《数据平安法》明确提出，国度要建立数据分类分级护卫制度，根据数据在经济社会发展中的重要程度，以及一旦遭到篡改、破坏、泄露或者非法获取、非法利用，对国度平安、公共利益或者个人、组织合法权益造成的危害程度，对数据实行分类分级护卫。国度数据平安工作协调机制统筹协调有关部门制定重要数据目次，加强对重要数据的护卫。关系国度平安、国民经济命脉、重要民生、重大公共利益等数据属于国度核心数据，实行更加…
AI
- 22
- 0
极盾科技23年3月13日
AI知道你脑子里在想什么，还帮你画了出来，项目代码已开源
一个「所见即所思」的世界将是什么样子？
AI
- 5
- 0
机器之心23年3月9日
PPC Insights系列：洞见宁静多方图联邦
知识图谱（Knowledge Graph）技术凭借其拓扑结构的信息关联关系和消息传递机制，能够对单体信息举行有益补充，因此正在被逐步应用于金融反欺诈、反洗钱和精准营销等场景。但是，因为现实社会中的数据孤岛问题，单一机构内的图数据往往只是一小部分，导致了更全面的关联关系和消息传递范式被阻断，这使得图数据的现实应用价格大打折扣。为此，洞见科技自主研发了“宁静多方图联邦（Insight Federate…
AI
- 15
- 0
新闻助手23年2月28日
恺望数据发布主动化数据产线，称「95%以上主动驾驭数据仍需人工标注」
GhatGPT的爆火带给了全世界一个热点问题：「人工智能真的能替代人力吗？」在当前仍依靠领域人力方式的数据标注畛域，主动驾驭数据服务公司恺望数据给出了一个双面答案——「能，但还不完全能替代。」2月17日，一场聚集了主动驾驭圈内技巧专家、汽车主动驾驭及智能网联畛域投资人参加的闭门交流会在北京举行。会上恺望数据透露，基于「主动化产线领域化人力」为核心的「恺望主动化数据产线」已经启用。据透露，该主动化…
AI
- 16
- 0
机器智行23年2月20日