https://linux.do 论坛的话题更新通知频道。
白芸汐 (@cloudwide) 在 [长文手敲] 简论机器学习——机器学习之前,先学会看数据(其二) 中发帖
数据表里没有一桩小事
上一篇我们反复申说,机器学习项目真正启动之前,最好先把数据这件头等大事端详清楚。
听上去像极了一句正确得令人打不起精神的唠叨。
好比出门前有人叮嘱你观测天象,下厨前提醒你刷锅净灶,写代码前告诫你先读懂需求文档。
道理桩桩件件都对,执行起来却常常被当作耳旁风,左耳进右耳出。
很多人接过数据以后,第一反应仍然是立刻让流程跑起来,片刻都不想耽搁。
导入 pandas,读取一份 csv 文件,瞄一眼前五行,确认没有当场报错,接着便是一气呵成的连续操作——切分训练集与测试集,挂载一个模型,最后目不转睛地盯住分数。
整个过程行云流水,手法娴熟,一副老师傅的派头。
唯一的问题是,数据可能从最初那一秒便开始不动声色地蒙骗你。
字段名称看上去无可挑剔,背后的含义或许南辕北辙。
数字排列得整整齐齐,单位却可能张冠李戴地混在一处。
类别列瞧上去干净利落,内里却可能藏匿着...🥒 (@stevessrbackup) 在 唉,免费鸡蛋啊 中发帖
[image]
[image]
[image]
[image]
[pasted-image-2026-05-18T03-10-53.png]
[pasted-image-2026-05-18T03-10-46.png]
[pasted-image-2026-05-18T03-10-27.png]
[pasted-image-2026-05-18T03-10-15.png]
[pasted-image-2026-05-18T03-09-51.png]
[pasted-image-2026-05-18T03-09-24.png]
[pasted-image-2026-05-18T03-09-21.png]
[pasted-image-2026-05-18T03-09-04.png]
[pasted-image-2026-05-18T03-08-55.png]
[pa...walkle 在 Reclip 开源自托管媒体下载器 中发帖
一个自托管的开源视频和音频下载器,具有干净的 Web UI。粘贴来自 YouTube、TikTok、Instagram、Twitter/X 和 1000 多个其他网站的链接 - 下载为 MP4 或 MP3。
有些视频不好下载可以通过该方式下载在本地。(终于找到焚决,有的小网站视频一直没有下载入口终于找到了!)🫣:
GitHub - averygan/reclip: Download videos from almost any website. Lightweight, self-hosted media downloader with a clean web UI. · GitHub黑大帅 (@ggzzh123) 在 又动了买车的念头... 中发帖
准备年底备孕,车子是必须要买了…
目前手里夫妻二人加起来有20w左右,借出去20w,俩人月薪合起来差不多2w左右,在上海。
预算20w一下吧,以前的梦中情车是坦克300,现在考虑长期在上海就只能电车了…然后还有长途需求
su7 超预算 家庭用车有些小 续航好
yu7 超预算 家庭用车及格 续航及格
理想i6 超预算 家庭用完美 续航稍差
极氪7x 超预算 不了解
小鹏,感觉随时倒闭的样子
怎么都是超预算啊,20w一下没有好电车么…