@hahaa 在 如何用大语言模型对从批量策略中提取skills 中发帖
正在做一些研究,让llm构造了许多策略,也有策略的结果,可以评判策略好坏。想问问各位是如何去从一个个策略实例中提取skills的啊,是一个一个提炼吗,还是批量输入之后让让llm去提炼啊。目前对skill的迭代很苦恼。求解答 🧐