数据标注行业竞争激烈如何破局?冰山数据提出最新解决方案,进一步降低成本

更新日期:2022年05月14日

       冰山数据是国内数据标示赛道中的新成员, 成立于2020年, 经过深度打磨的世界级供应链和AI辅佐数据标示渠道, 为头部AI企业供给全方位的数据收集和标示服务, 冰山数据在东南亚和非洲各国建立了独有的世界级众包资源网络, 仅一年时刻, 该资源网络已超越2000名标示员, 成功交给项目超越200余。除了丰厚的众包资源,

冰山数据还具有高效的数据标示渠道——冰山标示体系, 用于支撑标示保管、SaaS和私有化布置事务。
       在计算机视觉方面, 冰山标示体系支撑方针检测、语义切割等场景的预辨认技能, 在多语言方面可支撑80多种语言OCR和ASR预辨认, 为需求方供给更精确、更高效、更廉价的数据服务。什么是数据标示?——有监督机器学习的必要条件引证自:人人都是产品司理《谈谈数据标示那些事》要了解数据标示, 得先了解AI其实是部分替代人的认知功用。回想一下咱们是怎么学习的,

例如咱们学习知道苹果, 那么就需要有人拿着一个苹果到你面前告知你, 这是一个苹果。然后今后你遇到了苹果, 你才知道这东西叫做“苹果”。类比机器学习, 咱们要教他知道一个苹果, 你直接给它一张苹果的图片, 它是彻底不知道这是什么的。咱们得先有苹果的图片, 上面标示着“苹果”两个字, 然后机器经过学习了很多的图片中的特征, 这时候再给机器恣意一张苹果的图片, 它就能认出来了。咱们知道机器学习分为有监督学习和无监督学习。无监督学习的作用是不可控的, 常常是被用来做探索性的试验。
       而在实践产品应用中, 一般运用的是有监督学习。有监督的机器学习就需要有标示的数据来作为经历。数据标示职业的壁垒——高效的数据标示东西跟着近几年AI的迅猛开展, 进步模型迭代速度是AI公司的重要任务, 但数据标示的难度在不断进步, 仅靠人工操作难以进步数据标示的速度和质量, 多模态的交融数据更是无法用传统的标示东西比如常见的的Labelme、Labelimg等软件完结, 所以开发一款高效率且标示场景完全的数据标示渠道成为职业新的门槛。日前, 各家数据公司都在进步技能才能以到达节省人工标示本钱的作用, 一般的解决方案是经过将干流的开源模型与自家标示渠道进行加持, 用模型先进行猜测标示再由人工进行校对, 其次是经过优化数据流通管道, 完成项目主动拆分及主动分发, 或是经过模型质检、拟合质检、躲藏数据埋雷等方法进行辅佐质检, 经过这种方法不只能够削减过错标示, 一起能够节省很多的人工本钱。经过以上一切方法可节省大约30%的本钱。
       冰山数据开创团队在职业深耕5年之多, 几位开创人曾上任于各闻名数据公司, 开创人钟平曾任职于百度众测, 担任数据标示渠道产品司理, 深知前端标示东西和后端数据流通的痛点, 现担任冰山数据产品司理兼CEO, 致力于打造最完善的数据标示渠道——冰山标示体系, 协助进步冰山数据的技能竞赛优势, 在未来, 冰山数据方案打造冰山MLops, 供给数据标示到模型布置的一站式机器学习渠道。
       冰山标示体系经过算法对轿车鸿沟进行猜测标示数据标示竞赛剧烈, 怎么破局?——离岸众包网络, 低于国内三线城市人力本钱依据艾瑞咨询2020年《我国AI根底数据服务职业开展陈述》中的数据计算显现, “2019年我国AI根底数据服务职业商场规模到达了30.92亿元, 依据需求方投入状况和供应方营收增加状况计算, 估计2025年商场规模将打破100亿元, 年化增加率为21.8%”。依据其他职业数据显现, 闻名数据渠道公司如海天瑞声、数据堂等公司商场占有率仅约30%, 其他70%商场仍把握在人力供货商如河南、贵州等用人本钱较低的区域。在一线城市, 一个经历丰厚的标示员日薪约为180-200元之间, 在三四线城市约为120-150元之间, 冰山数据经过高效的标示东西, 合作冰山数据独有的东南亚和非洲等贫困区域的离岸众包网络, 可到达65元/人/天的最低价格, 如常见的2D方针检测框, 商场价格约为0.1元/标示, 冰山数据仅收取0.05元/标示, 为AI公司供给最低价格的数据标示服务, 并协助其完成模型快速迭代。冰山数据开创团队以为, 在不久的将来数据标示职业将从头洗牌, 冰山数据将经过技能提高+离案众包的低本钱优势从商场中获得很多比例, 在很多数据标示公司中锋芒毕露。冰山数据印度团队训练相片

Copyright © 2001-2021 厦门证券有限公司 xiamenzhengquanyouxiangongsi (blondeherbivore.com) ,All Rights Reserved