Anthropic представила новые методы предотвращения шантажа и опасного поведения ИИ Claude
Американская компания Anthropic опубликовала результаты исследования по усовершенствованию своих моделей искусственного интеллекта Claude, направленных на минимизацию рисков шантажа, саботажа и…