7月4日,“Baidu Create 2018”百度 AI 开发者大会将在北京国家会议中心举办,一场汇集全球的开发者盛宴正式拉开帷幕。现场,百度高级副总裁王海峰介绍了百度大脑3.0,指出多模态深度语义理解是百度大脑3.0最大的变化,开放了110+项能力。
王海峰博士表示,百度大脑3.0 的多模态深度语义理解包含视觉、语音、自然语言、数据语义以及多元语义这些因素。他重点指出,基于百度大脑的视觉语义化技术可以让机器全面识别视频中内容。比如世界杯期间,机器可以识别出比赛视频中的球员、裁判、球、以及球门、球场线等人、物和场景,可以捕捉射门、进球、角球、任意球、换人等事件。进而提炼出结构化语义信息。
除此之外,该技术还可以运用到我们生活中方方面面,比如在无人超市等新零售场景中,视觉语义化技术可以准确识别顾客“拿起商品”、“放下商品”、“将商品从A处放到B处”等行为,从而判断用户购买了哪些商品。还可以在用户离店时通过人脸支付主动扣款。为超市减少运营成本的同时,也提高了消费者的购物体验。
相信在未来,我们可以看到更多百度大脑带给我们的便利。
还没有评论,来说两句吧...