IU X-ray 数据集是专门用于胸部X射线图像的医学数据集,广泛应用于胸部疾病诊断研究。
数据集概述
- 数据来源:印第安纳大学(IU)研究人员从印第安纳州患者护理网络10数据库中提取15。
- 图像与报告配对:数据集包含7,470对胸部X射线图像及其相应的诊断报告24。
数据集特点
- 标注与量化:使用Mesh(医学主题词)对报告中的Finding和Impression进行编码,并对数据进行量化统计,平均每个报告77.1个词,非正常报告平均84.5个词1。
- 数据清洗:清洗掉与报告无关的内容,如时间等,确保数据质量1。
应用领域
- 疾病诊断:常用于胸部疾病如肺炎、肺结核等的计算机视觉研究3。
- 性能评估:使用自然语言生成和临床疗效指标评估模型性能,消融研究显示各模块对提高报告质量均有贡献7。
数据集规模
- 图像数量:共8121张图像,实际公开7470张1。
- 报告数量:共3996份报告,公开3955份1。
IU X-ray 数据集为医学图像分析和自然语言处理领域提供了丰富的资源,有助于推动相关技术的发展。24