《经济学人》表示:当今世界最有价值的资源不再是石油,而是数据。数据的流动、叠加、汇聚可以满足目前数据市场多样化需求,实现数据价值最大化。尤其是人工智能再次崛起之际,大数据 人工智能将是产业创新发展最重要的工具与手段,缺少训练数据的人工智能恰是巧妇难为无米之炊。
百度深知数据流动起来才会具有价值;为此,百度云推出百度数据众包服务平台,这是面向企业服务的一项能力,以“让数据价值链畅通”为使命,推动数据价值普惠大众。
百度众包让巧妇有“米”
在智能经济时代,摆在所有商业组织面前的难题是:如何获取数据,如何处理数据。来看一个真实的案例:某客户需要大量高精度花卉类图片,用于模型训练、调优、粗细粒度识别能力迭代等多种工作。初期图片需求量大、涵盖花卉品类繁多、数据处理需要耗费用户大量的资源和时间成本;而现实情况是,该用户自身并无能力快速完成数据的挖掘与处理,很难真正实现数据的价值,类似这种情况已成为普遍现象。
针对这一普遍性挑战,百度云为广大企业用户提供了百度数据众包服务,该项服务使用低成本高效率的众包模式来满足客户们对数据的需求:通过采集大量原始数据、并用数据标注对原始数据进行加工,最终提供计算机可识别的高质量数据,从而为用户的数据应用和业务创新奠定坚实的基础。
百度数据众包服务两大核心功能是:数据采集和数据标注。数据采集包括文本、图谱、语音视频、o2o|lbs等数据的采集以及问卷调研,可以满足用户各种复杂场景数据采集的需求,且通过海量众包用户线下采集的方式,为客户提供丰富的源数据。数据标注则包括数据的分类/清洗、数据校验/评估、数据内容提取等,利用专业的标注团队将源数据转化为可用数据,满足用户大规模的数据处理需求。
百度数据众包平台充分利用众包模式的优势,通过技术和人力的规模效应为用户提供低成本、高效率的数据服务,彻底解决用户在数据采集和数据标注上的后顾之忧。百度数据众包之所以能提供低成本、高效的数据服务,是因为有以下五大优势:
专业的众包服务处理流程(且支持定制化开发):强大的平台功能和多样化基础工具科学合理的作业流;专业项目人员全流程一对一跟进,实时掌控项目进度,保障了用户数据需求的速度和质量;另外还可以为用户量身定制特殊的采集、标注工具;
高效的数据处理速度:百度数据众包服务采用的众包模式具有强大的人力优势,覆盖300 城市的万名专职外场数据采集员、5000 在线标注人员、45种标注场景、100 核心专职数据处理专家可以满足用户所有厂家和数据量的需求,为用户提供快速、高效的百万级数据标注处理能力;
多重机制保障数据高质量:百度众包服务拥有7年的数据行业积累,设置了多道数据质保屏障,确保数据质量的验证和调优;比如,严格的人员培训考核准入机制,多重数据人工审核质检机制、人工智能辅助审核,数据质量远高于行业水平;
全面和优质的服务:百度众包服务在需求接洽、方案设计、众包执行、质量保障、结果验收,全流程均有专业项目人员实施跟进,为用户提供更加全面和优质的服务;
性价比出众:成熟的众包任务分发模式、易用的采集与标注终端工具,性价比首选;
此外,百度数据众包服务提供数据公有化和私有化数据交付。客户如果选择公有化交付,只需在开放云直接提交需求或上传待处理数据,项目执行完毕后,下载结果数据,非常方便快捷;客户如果选择私有 化交付,则需要在公司内网部署数据客户端,在公司内网批量提交需求并获取结果数据,数据隐私性更高。
百度众包:数据服务经验深厚、应用场景丰富
百度众包服务自成立以来,服务内外超过50 产品线/客户,积累了深厚的数据服务经验,累计完成了5亿张图片标注,3亿条文本、网页类数据标注。百度众包服务还拥有丰富的应用场景和大量成功案例,包括智能交通数据应用、电子商务应用、智能语音数据应用以及ocr数据应用等。下面是几个经典应用场景和真实案例:
某城市的交通要素的图像识别。该项目需要对500000 张道路图片进行内容实体标注,且标注的实体为多类型的交通元素,包括小汽车、客车、大货车、行人、交通设施等,标注规则多达21项,识别类型多,操作复杂、精细度要求极高;通过百度数据众包凯发ag旗舰的解决方案,该项目培训了200 合格的标注员,日标注能力达到6万框/天,数据质量高达99%;
某客户的呼叫中心录音数据转写与分析。某客户的呼叫中心存在大量的客户录音数据需要进行转写和分析,包括语音角色判断,语音内容切分以及语音内容转写,所有流程的操作复杂,且对数据因素和安全性要求极高;百度数据众包为该客户定制化了加密的语音播放器,且有专人进行审核和保障质量,实现了一次性交付。
一直以来,百度云都致力于构建以abc(ai人工智能、bigdata大数据、cloud computing云计算)基础能力为核心的能力体系,以此来满足广大企业用户不同的场景需求。百度众包作为百度能力体系中的一员,将充分利用百度云综合的科技能力,能够很好地帮助企业用户解决如何获取数据、如何处理数据的难题,让大众真正享受到数据所带来的价值。(本文来源:百度云微信公众号)
【凯发ag旗舰的版权声明】:本站内容来自于与互联网(注明原创稿件除外),供访客免费学习需要。如文章或图像侵犯到您的权益,请及时告知,我们第一时间删除处理!谢谢!