客服热线:0769-81373331??13924330797 ??|??E-mail:2121283975@qq.com

www.qg111.com|钱柜娱乐手机版登录|电子寄存柜|智能充电柜|智能保密柜|智能洗衣柜|智能文件柜|智能枪弹柜|超市存包柜|工厂手机柜|工厂存包柜|智能手机柜|寄存柜厂家|钥匙柜厂家|快递柜厂家|智能寄存柜|自助寄存柜|智能存包柜|电子寄存柜厂家|智能图书柜|图书馆智能柜|www.qg111.com装备

www.qg111.com|钱柜娱乐手机版登录|电子寄存柜|智能充电柜|智能保密柜|智能洗衣柜|智能文件柜|智能枪弹柜|超市存包柜|工厂手机柜|工厂存包柜|智能手机柜|寄存柜厂家|钥匙柜厂家|快递柜厂家|智能寄存柜|自助寄存柜|智能存包柜|电子寄存柜厂家|智能图书柜|图书馆智能柜|www.qg111.com装备

机器智能的关键

         使用大数据,相当于在一堆沙子中 淘金,不经过处理的原始数据是给不出 什么新常识的,大数据能产生的效益在 很大程度上取决于使用(和挖掘)数据的 水平。在谷歌,至少有四成的工程师 天天在处理数据,然后通过数据得到知 识,通过常识使得计算机变得更智能。
        大家在强调收集大数据是无目的性 的同时,也给处理大数据增加了难度。由 于大数据的原始数据常常是没有固定格 式、显得杂乱无章的,因此使用大数据的 第一步是对数据的过滤和整理,去除与 要解决的问题无关的维度,将与问题有 关的数据内容进行格式化的整理,以便 进一步使用。数据的过滤和整理有时很 容易,比如大家希翼通过日志分析一款 游戏玩家的行为,这只要把相应的维度 保留下来,把无关的信息过滤掉即可。但 是,在很多应用中,即使这一步也不容易 做到。比如在前面提到的机器自动问答 的例子中,虽然问题的答案存在于网页 之中,但是答案的内容通常是七零八落 地分布在不同网页里的,对网页的结构、 内容进行分析就成了使用大数据的先决 条件。当然,如果没有很好的自然语言理 解技术,这第一步都无法完成。 虽然香农告诉大家,信息越多,大家 就越能消除系统的不确定性,但是数据 中常常不仅仅是信息,还不可避免地夹 杂着噪声,这个问题在大数据中特别明 显。使用数据的人常常会发现某些数据 的质量高,而另外一些数据的质量不是 SP么高。当然,简单地用质量高和质量低 是不足以准确定量地衡量数据质量的。 在信息处理领域,大家使用一个被称为 信号与噪声之比(Signal Noise Ratio, 简称信噪比SNR)的度量来描述信号的 质量。如果数据中的信噪比很高,数据就 可靠;相反,如果信噪比太低,可能有限 的信息会被淹没在噪声中,这样的数据 使用后可能产生不了什么好的结果。对 于那些夹杂着大量矂声的数据,为了提 高数据的信噪比,在使用数据之前,大家 常常需要进行降噪处理,损失一部分数 据,以提高信噪比。现在,大家可以认为这样处理过的 数据能直接使用了,接下来关键的一步 就是机器学习。机器学习并不是什么新 鲜事,今天广泛使用的机器学习算法,比 如人工神经网络算法、最大熵模型、逻辑 自回归等,早在40年前就已经成熟了。但 是由于数据量不够,导致机器学习的应 用范围比较窄,再加上它是介于应用数 学、统计学和计算机科学之间的交叉领 域,因此一直没有受到太大的重视。2000 年以后,随着计算机速度的增加和数据 量的暴增,机器学习在很多领域发挥了 重大作用。2016年谷歌创造奇迹的 AlphaGo,其训练算法就是人工神经网 络。

?
XML 地图 | Sitemap 地图