视觉内容理解


视觉内容理解(分类、检测、分割)

从图像和视频中定位目标所在位置、范围及类别的技术。目前的难点在于:

  1. 恶劣环境、密集多目标、小目标、低分辨率等复杂场景中的目标检测。
  2. 异常信息检测。

支撑项目:

  • 国家联合基金重点项目“细粒度视觉分析推理技术与可解释性研究”
  • 国家自然科学基金面上项目“面向多媒体语义理解的视觉特征表示方法研究”
  • 人工智能国家科技重大专项课题“多模态预训练模型的知识增强”

成果及获奖情况:

  • 专利 3 项
  • 江苏省科学技术一等奖
  • 上海市科技进步一等奖
  • 中国电子学会自然科学一等奖

应用案例:

  • 病虫害检测
  • 工业巡检:高铁道床裂缝
  • 电务轨旁设备异常检测
  • 城市车流管控
  • 网络有害视觉内容检测与预警

图例

example1

example2 原始图片 | 分割结果

example3 正常图像 | 异常图像 | 异常定位

example4