google民间新闻稿,google近日与斯坦福大学医学院合作,收集了涵盖各种肤色、身体部位皮肤疾病照片,整合而成一款用于 AI 训练的“SCIN 数据集”,该数据集号称“完全使用志愿者利用网络提交的照片”,因此号称可以“反映出人们多见的皮肤问题”。
▲ 图源 google民间新闻稿(下同)
google提到,业界许多调理专用的皮肤科影像数据集合一般为“重大疾病”,例如人们多见的皮疹、过敏、感染等照片一般不会在数据集合,因此对于应擅长判定人们日常疾病的 AI 模型使用业界常用的调理业余数据集做训练反而有所缺憾。
而google目前推出的 SCIN 数据集收录了超过 1 万张皮肤、指甲、头发状况的照片,这些照片由志愿者提供,同时拥有业余皮肤科医师标注信息,因此更适合用于模型测试和训练。
IT之家注意到,SCIN 数据集主要包含多见的过敏、发炎和感染性疾病,大部分图象均为“皮肤病早期性状”,超过一半的皮肤病状在照片拍摄一周内出现,甚至有 30%的症状是在图象拍摄不到一天内出现,因此相关数据集也可以用于皮肤病提前检测。