GitHub 的 Copilot 可能是目前最为知名的 AI 代码生成系统,只需要提示它就能根据上下文写出相应的代码,帮助开发者减少重复性的编程工作。Copilot 是基于 OpenAI 的 Codex,其训练集未公开,研究人员无法对 AI 模型进行微调或调查其可解释性。虽然在性能上比不上顶尖的代码生成器,但研究人员表示 PolyCoder 在 C 语言上其代码精度高于包括 Codex 在内的其它模型。研究人员称大型科技企业不公开模型阻碍科学研究和大型代码语言模型的大众化。他们希望自己的开源代码生成模型能说服其他人采用类似的做法。