科技行业发展滚滚向前,不过一直以来,中国科技行业都是一个追随者,可以说在PC时代我们是一个完全的学习者,而在互联网时代,我们的网络应用和服务开始能够和海外巨头并驾齐驱,而到了移动互联网时代,开始呈现领先全球的态势,中国移动互联网发展的进程远超西方发达国家,很多人都觉得中国人太依赖手机了。不过想要领先世界,那么机会真正出现在人工智能领域,AI改变世界已经是一个不争的趋势,而在这个领域,中国科技界正在凝聚一股强大的力量。
AI三要素和人工智能五小强
在互联网乃至移动互联网时代,大家突然发现中国赖以成功的人口红利优势依然存在,不断增加的互联网用户带来了非常好的发展基础。即便是在最近两年,下沉市场还带动了拼多多这样的企业诞生,可以说,市场规模依然是科技界的最大优势。不过让人感到欣慰的是,这种优势还将继续起作用,到了人工智能时代,依旧是中国科技行业能够实现弯道超车的基础。因为大量的人口红利、多样且丰富的使用场景、对新技术的接受程度等等因素叠加,产生了大量的可在AI场景中数据,这种数据样本从规模到价值都非常宏大。对人工智能三要素来说,这也是其中为关键的数据优势。
AI三要素是指算法、算力和数据,用简单的话讲,算法可以说是计算的方法,好的算法效率高,准确率高,而算力则是硬件能力,在量子计算机诞生之前,在算力方面,不会产生什么跨时代的差距,而目前努力的方向也是芯片产品的小微化,能够让更多的智能设备具有运算能力。而5G的发展将会带来一个非常巨大的变革就是设备可以共享云端算力,这会大大增强智能设备的算力,这也是为什么我们会说5G时代才是真正的万物互联的原因。而数据这个层面,那就非常简单了,是AI学习的基础,就好像是你读的书,简单的可以说,你读的书越多,你也就越聪明越有智慧。而在这个层面,各大科技公司开始出现了一些差距。
目前中国在AI数据方面还是具有显著优势的,硅谷的人工智能公司大部分都只能在算法上想办法。而中国市场的数据规模更为庞大,更多的公司可以提供这些数据来供人工智能公司进行学习,由此产生了一个非常好的人工智能生态,而一旦这个生态达到临界爆发,人工智能的自学习能力达到一定的程度,那么就会产生一个代际的差距,就好像大学生和小学生一样。而目前中国在人工之智能领域有五家公司被业界称为“五小强”,算法层有商汤、旷视,AI数据领域有云测数据,硬件方面有涂鸦智能、地平线,这些公司虽然不是BAT级的巨头公司,但是在人工智能领域都有着自己专业的深耕和成果,可以说是中国人工智能领域弯道超车的中坚力量。
AI领域的数据英雄
在人工智能“五小强”中都是人工智能领域的头部企业,商汤、旷视经常在视觉和识别等方面一骑绝尘,而涂鸦和地平线,支撑了目前大量的智能产品进入全球千家万户,而云测数据用高质量的AI数据撑起了人工智能的一片天,曾被媒体称为“AI领域的数据英雄”。简单说,云测数据就像是生产行业燃料的企业,帮助算法公司去把数据进行标记,从而实现更好的学习效果,而这个工作可以说是非常庞大和繁琐,但确实又非常重要。不然再好再多的数据,也没有办法实现他们的核心价值。
比如人工智能领域有一个有趣的话题,人脸识别的准确率对于有色人种随着肤色的加深会大大下降,这里有一个很重要的原因就是训练数据的不足。如果想要训练一个低精度的人脸识别比如性别识别,那么随便标注性别人像的数据就可以了,但如果要精准识别一个人,就要有不同维度的被标注好的数据。由此也就诞生了定制化的AI数据服务,还原或搭建真实使用场景中所需要的环境,采集好定制化的场景数据并经过精准标注后,用这些高质量数据去训练算法模型,才能使其具有越来越智能。
这种定制化的数据服务能力的要求很高,必须具备对场景深度的还原能力、作业协同化能力、专业化能力这三种能力,首先保证对用户的需求进行精准的拆解、理解甚至预判,其次设立专业规范的协作流程,最后有足够专业的人士能够保证数据标注的质量。比如说,在医疗领域做X光片病理诊断中,标注人员需要非常专业,甚至是副主任医师专业以上的级别,才能对病理的片子进行正确的数据标注与解读。类似的情况也出现在教育、法律、智能驾驶等多个领域。
而云测数据正是这个领域的头部企业,他们通过自建数据标注基地和场景实验室的方式,打造专业的定制化采集和高质量的标注队伍,帮助人工智能企业获取更多优质的特定场景数据,持续为AI训练、优化提供安全可靠、精准高质的数据服务。现在已经覆盖了智能驾驶、智慧城市、智能家居、智慧金融、新零售等诸多领域的定制化的数据采集、数据标注服务,实现了语音、图像、文本、视频的全领域覆盖,全方位支持各类型数据的处理。可以说是成为了人工智能领域的数据基础服务提供者。目前已经拥有了行业内最大规模的专业数据服务全职人员,成功为上百家企业提供了AI数据服务。
数据优势是核心优势
目前在算法和算力方面,其实并没有什么代际的差距,所以人工智能竞争的关键核心,还是在数据本身,这是行业的源头活水,也是发展的关键。不过对于人工智能公司来说,选择第三方的数据标准公司已经是当下最优的选择,这里面存在人员成本、专业程度以及效率质量等多方面问题,可以说越专业的数据公司就有着越高的数据标记能力,更有着丰富的数据标记经验和对客户训练需求的深刻理解。这对于云测数据来说,其实是一个很好的机会,而随着行业规模的不断扩大,其领军和带头作用也越发明显,而其在隐私保护、数据安全等方面的高标准,也逐渐成为行业的标杆。所以云测数据也开始越来越多的出现在大众视野之中,从相当程度上推动了AI 数据行业的规范化发展。
不过总体来看,整个数据领域的水平还有待发展,还有大量良莠不齐的外包团队,进行一些游击战式的数据标注服务,但随着企业对数据标准要求的提升,数据标注向着更专业的方向发展是大势所趋,因为这样才能建立真正的人工智能壁垒,毕竟最好的建筑材料才能建设起最坚固的房子。云测数据总经理曾说过,“以人脸识别为例,以前的需求是拉框、标注五官,现在需要标注几百个点,精确到3-5像素以内。而诸如智能驾驶领域的3D点云标注、和家居、金融等领域涉及的NLP标注等,对数据标注的整体能力也有更高的要求”这种级别的数据服务,门槛还是相当高的。
其实从社会发展来看,倒也有很多相似之处,之前我们追求经济发展的速度,现在则追求经济发展的质量,只有速度没有质量,最后还是沙上建塔,经不起风浪的冲刷。而中国人工智能行业如果想要真正实现弯道超车和逆袭,对数据标注方面的专业度提升和投入,还是要加大关注。而云测数据这样的专业机构,也会迎来更大的发展空间。
文章来源:砍柴网 编辑:冷冷