Тред про использование ML в инструментах разработки

Задачи “ML on code” сейчас очень популярны
Одна из наиболее популярных задач – генерация кода на основе больших моделей.
Пример TabNine https://www.tabnine.com/blog/deep
Один из популярных подходов – использования моделей естественного языка применительно к коду.
Пример BERT https://github.com/microsoft/CodeBERT
Два примера решения задачи по генерации SQL кода https://paperswithcode.com/sota/text-to-sql-on-wikisql и https://paperswithcode.com/sota/text-to-sql-on-spider
О @OpenAI's GPT-3 сегодня не говорит только ленивый
Здесь много интересных примеров применения GPT-3 https://github.com/elyase/awesome-gpt3
Другая популярная задача – поиск кода. Полтора года назад Microsoft проводила соревнования в этой области https://github.com/github/CodeSearchNet
Здесь можно посмотреть результаты https://wandb.ai/github/codesearchnet/benchmark/leaderboard
Тренды с последней крупной конференции по NLP ACL 2020 https://www.topbots.com/highlights-of-acl-2020/
В этом году на NIPS проходит соревнование по генерации bash команд http://nlc2cmd.us-east.mybluemix.net/#/