白芸汐 (@cloudwide) 在 [长文手敲] 简论机器学习——前言 中发帖
在机器会学习之前,人类先学会了偷懒
谈机器学习之前,最好先把一个经典的误会放到桌面上。
很多人第一次听到机器学习,脑子里浮现的画面大概是这样的。机房深处,一台通体发光的服务器缓缓睁眼,屏幕上飘过一串绿色代码,然后它用冷酷的电子音宣布,人类,我已经掌握了你们的秘密。(天网的算力都不够现在的LLM用的)
这画面很赛博,很带感,很适合拿去剪短视频,配上低沉旁白,再加一句经典台词。
时代变了。
可惜现实通常没这么酷。
更多时候,机器学习的现场看起来像这样。
一个人坐在电脑前,盯着报错看了半小时,发现路径写错了。一个模型训练了八个小时,最后准确率还不如随机森林。
一个神经网络参数量大得吓人,结果上线后被用户一句方言干沉默。
老板问为什么效果不稳定,工程师说数据还需要清洗。
老板问清洗多久,工程师低头看了一眼表情包,心想这事儿已经不属于科学,属于渡劫。
所以机器学习这东西,表面看是...