财神彩票-财神彩票
财神彩票2023-10-14

财神彩票

向善而生的AI助盲,让AI多一点,障碍少一点******

  有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。

  AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。

  新契机:多模态算法或将造福数以亿计失明者

  科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。

  一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。

  多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。

  大挑战:如何看到盲人“眼中”的千人千面

  AI助盲看似简单,但多模态算法依然面临重大挑战。

  多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。

  但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。

  另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。

  为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。

  另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。

  最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。

  多解法:浪潮信息AI助盲靶向消灭痛点

  AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。

  在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。

  盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。

  目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。

  真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。

  在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。

  眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。

新型举国体制助力科技自立自强******

  作者:白俊红、陈新、郭进(南京师范大学商学院)

  科技创新是推动国家富强与民族复兴的核心动力。在激烈的国际竞争中抢占高地、掌握话语权,归根结底要依赖关键核心技术的攻关和突破。相较于一般的技术创新,关键核心技术的研发往往是“难啃的硬骨头”,不仅涉及要素的协调配置、研发团队的通力合作,离不开党中央的统一领导和政府相关部门的有力引导,甚至需要举全国之力。党的二十大报告指出,要完善党中央对科技工作统一领导的体制,健全新型举国体制,强化国家战略科技力量,优化配置创新资源。当前,面对新一轮科技革命和产业变革的历史机遇与挑战,充分利用新型举国体制强大的资源调配能力与组织动员能力,实现核心技术创新领域的关键性突破,从而助力科技自立自强已迫在眉睫,需从多个角度精准把握、积极推进。

  新型举国体制应新时代而生

  我们党历来重视科技创新的发展及技术进步引领下的经济增长。新中国成立后,为适应当时创新资源匮乏、科技基础薄弱的历史条件,我国积极在全国范围内统一调配资源,在国防、航天等重大领域取得了举世瞩目的成就。而随着研发资源的不断积累和人才队伍的迅速扩张,以及市场在资源配置中的决定性作用日益凸显,我国科技创新的大环境已然发生变化。探索新时代下契合我国科技创新大环境的新型举国体制,是对传统举国体制的继承与创新,亦是我国协调资源攻坚克难、化解矛盾着力创新的必然选择。

  第一,明确市场机制的决定作用。新型举国体制继承了传统举国体制所体现出的强大制度优势,牢牢握紧“统一指挥、高效动员、协同攻坚”的大旗,依然强调中央政府在国家重大技术突破中承担的引领和协调作用。世界经济形势风云变幻,举国体制的主体结构面临优化升级,亟须通过政府与市场的有效协作来实现技术突破,形成以有为政府为主导、有效市场相协同的创新局面。

  第二,把握因事制宜的运行手段。我国“十四五”规划和2035年远景目标纲要明确指出,“坚持创新在我国现代化建设全局中的核心地位,把科技自立自强作为国家发展的战略支撑”。新型举国体制在传统举国体制的基础上,明确了举国体制的适用范围,以区分其在不同科技创新项目中的作用程度。概括而言,在关系国家重大利益的关键科技领域,强调发挥新型举国体制的主导作用;对于适宜分散式研发的科技创新项目,新型举国体制则保留个体创新的自主性。

  第三,依托数字技术的全新力量。伴随新一轮科技革命和产业变革,我国的数字经济已取得长足发展,为工作协同、机制建设、政策执行等提供了重要的技术支撑。2021年10月,习近平总书记在十九届中央政治局第三十四次集体学习时指出:“要牵住数字关键核心技术自主创新这个‘牛鼻子’,发挥我国社会主义制度优势、新型举国体制优势、超大规模市场优势,提高数字技术基础研发能力,打好关键核心技术攻坚战,尽快实现高水平自立自强,把发展数字经济自主权牢牢掌握在自己手中。”数字经济能够打破时空限制,有力推进组织动员与资源调配,无疑是保障新型举国体制运行效率和长期发展的重要“法宝”。

  以有效市场合理配置为抓手

  习近平总书记在中国科学院第二十次院士大会、中国工程院第十五次院士大会和中国科协第十次全国代表大会上强调:“要推动有效市场和有为政府更好结合,充分发挥市场在资源配置中的决定性作用,通过市场需求引导创新资源有效配置,形成推进科技创新的强大合力。”创新资源市场化配置是新型举国体制下实现关键核心技术突破的重要基础,同时也是实现科技自立自强和建成社会主义现代化强国的重要保障。市场对创新资源配置的影响体现在要素流动、产权保护、价格稳定和市场运作等方面,构建适宜新型举国体制的创新要素市场化配置机制,有助于提高创新资源配置效率,着力实现关键核心技术突破。

  创新资源的有效配置也是实现技术需求和创新供给有效对接,推动产业链和创新链深度融合的关键环节。习近平总书记指出:“要围绕产业链部署创新链、围绕创新链布局产业链,推动经济高质量发展迈出更大步伐。”新型举国体制下实现关键核心技术的突破,需要重视核心技术与产业发展的紧密关系,重视市场机制在其中的重要作用,推动研发要素向产业链上具有更高生产率的企业与部门流动。同时,鼓励企业以市场需求为导向,充分利用市场在核心技术突破和产业转型升级中的关键作用,强化关键研发成果的转化应用。

  一直以来,政产学研金之间的协同创新,不仅在中微观层面推动了产业升级与企业转型,更在宏观层面被视作充分发挥中国特色社会主义制度“集中力量办大事”的显著优势、形成自主创新体系的着力点。推动建设新型举国体制,要围绕对国家发展和经济安全具有重大战略意义的科技创新领域进行统筹布局,推动行政机制和市场机制深度融合,充分激发和提升政产学研金各类主体的创新活力与协同效率。在新型举国体制下,市场机制赋予协同创新以全新的运作逻辑,必须利用好市场这只“看不见的手”,加快发展政府特设机构主导的协同创新、大型央企和头部民营企业主导的协同创新以及国家级科研机构主导的协同创新等模式,推动关键核心技术研发实现里程碑式跨越。

  以有为政府统筹领导为保障

  习近平总书记在中央全面深化改革委员会第二十七次会议上强调,健全关键核心技术攻关新型举国体制,要加强党中央集中统一领导,建立权威的决策指挥体系。加快构建新型举国体制,党中央的统一领导是核心生命力,有为政府的统筹领导与有效决策是根本保障。在充分发挥市场机制在资源配置中的决定性作用的同时,仍需有为政府的科学统筹与顶层设计,以形成新型举国体制下科技创新发展的强大助力。

  一是统筹资源配置。通过对人才、资金等资源的全局配置,在充分激发市场主体活力的同时,平衡利益分配,不断完善组织管理制度,有力发挥在科技创新领域中“集中力量办大事”的制度优势,着力提升组织动员能力与宏观调控效率。在整体规划部署下,将科技创新战略与研发资源的市场化需求、企业的核心技术攻关方向有机结合,从而更好落实创新驱动发展战略,实现高水平科技自立自强。

  二是科学简政放权。全局规划、统一调配不是行政制度的弃“简”从“繁”。新型举国体制下,深化政府部门改革,合理压缩相关行政审批,及时为市场及企业减负。务实有效的简政放权将激发各类创新主体的活力与动力,形成各部门各领域协同的良好局面,凝聚起新型举国体制下关键核心技术攻坚所需的人力、物力、财力等各项资源。

  三是重视要点规划。关键核心技术突破要科学谋划。习近平总书记指出:“要加强战略谋划和系统布局,坚持国家战略目标导向,瞄准事关我国产业、经济和国家安全的若干重点领域及重大任务,明确主攻方向和核心技术突破口,重点研发具有先发优势的关键技术和引领未来发展的基础前沿技术。”在具体政策制定时,应当综合考虑科技创新项目的整体发展方向与近期亟须攻克的重点任务,优先聚焦国家当前重要战略需求,精准实施,重点突破。这就要求以新型举国体制为抓手,筛选若干关键核心技术创新对象,对重点项目进行持续跟进,切实提高关键领域自主创新能力,提升国家创新体系整体效能。

  (本文系国家社科基金重大项目“新型举国体制下技术突破的市场机制和政策路径研究”(21&ZD122)阶段性成果)

中国网客户端

国家重点新闻网站,9语种权威发布

财神彩票地图