转自:https://twitter.com/OpenAI/status/1655982364273831936?s=20
我们将 GPT-4 应用于可解释性——自动为 GPT-2 的 300k 神经元提出解释——并发现神经元对明喻、“正确完成的事情”或确定性表达等概念做出反应。我们的目标是使用Al来帮助我们理解Al:Language models can explain neurons in language models (openai.com)
© 版权声明
文章版权归作者所有,未经允许请勿转载。