视觉内容理解
视觉内容理解(分类、检测、分割)
从图像和视频中定位目标所在位置、范围及类别的技术。目前的难点在于:
- 恶劣环境、密集多目标、小目标、低分辨率等复杂场景中的目标检测。
- 异常信息检测。
支撑项目:
- 国家联合基金重点项目“细粒度视觉分析推理技术与可解释性研究”
- 国家自然科学基金面上项目“面向多媒体语义理解的视觉特征表示方法研究”
- 人工智能国家科技重大专项课题“多模态预训练模型的知识增强”
成果及获奖情况:
- 专利 3 项
- 江苏省科学技术一等奖
- 上海市科技进步一等奖
- 中国电子学会自然科学一等奖
应用案例:
- 病虫害检测
- 工业巡检:高铁道床裂缝
- 电务轨旁设备异常检测
- 城市车流管控
- 网络有害视觉内容检测与预警
图例
原始图片 | 分割结果
正常图像 | 异常图像 | 异常定位