@Samiya_Z 在 关于safety模型的一些,也许算是猜测?乱七八糟 中发帖
我突然想到就是一个科学预测是Kurzweil一派的未来学预测,大概就是“2045年会迎来科技奇点”。
我想是不是因为越来越多人觉得强AI可能来得比以前想的更快,先进AI可能在不太长的时间内跨过一些关键能力阈值,而且风险不能等到最后再处理,所以拼命提前加强safety;至于为了公司不赔钱只是其中一小部分原因。
2025年的 International AI Safety Report 总结:通用AI能力近年进展很快,未来进展可能从慢到极快都有可能,而政策制定者面临的难点恰恰是进展快且不完全可预测
我自己是把AI会自己学习升级分为4个层级:
自己改自己的答案。像Self-Refine这类方法,就是模型先给答案,再自己批改、再重写,很多任务上能提升输出质量。
在规则明确的环境里自己练出来。AlphaZero我认为就是就是一个经典例子,因为它主要靠自self-play从零开始...