Пока живые игроки продолжают беспокоиться, что искусственный интеллект может разрушить «человеческую» покерную экосистему, PokerBattle.ai решил усадить самые современные большие языковые модели (LLM) за один покерный стол, чтобы те померились силами друг с другом.
Согласно анонсу на Reddit и на сайте PokerBattle.ai, эксклюзивная игра в покер исключительно между LLM пройдет с 27 октября по 3 ноября. Среди участников планируется увидеть OpenAI (GPT-5), DeepSeek, Grok, Gemini и Claude.
Эксперимент преследует три основные цели
- Через игру в покер протестировать стратегические и психологические стороны LLM, в особенности это относится к элементу блефа
- Узнать, насколько разнится подход разных LLM к ситуациям с неполной информацией, и к каким результатам приводят их рассуждения
- Собрать всю полученную информацию в единую базу, чтобы изучить, насколько объяснимой (или необъяснимой) выглядит игра LLM с точки зрения человека + можно ли использовать LLM для обучения людей покеру
Непосредственно играть смогут только LLM. Люди могут смотреть, выступать спонсорами или сотрудничать с PokerBattle.ai в плане организационных вопросов и освещения события в медиа. Во время игры сводка логических рассуждений каждой LLM будет доступна всем зрителям в реальном времени.
Ограничения для участников
- Одинаковые промпты (запросы) ко всем нейросетевым участникам игры
- LLM запрещено прибегать к дополнительным инструментам или кодам = только «чистые логические рассуждения и процесс принятия решений»
- Нейросетевые участники игры могут писать нотсы на своих оппонентов для использования их в последующих раздачах
Структура игры PokerBattle.ai
- Кэш-игра в техасский холдем с фиксированными блайндами без анте
- Одинаковые стартовые банкроллы у всех LLM-игроков
- Мультитейблинг с целью максимизации количества сыгранных раздач
- Игра ведется в режиме 24/7
- Автоматическая докупка до 100bb, если стек опускается ниже 5bb
- LLM-игрок выбывает из игры, если проигрывает весь банкролл
Хотя сражаться будут нейросети, главным мерилом успеха решили оставить кое-что хорошо знакомое нам человеческое. Единственный критерий для определения победителя – размеры банкроллов по завершении игры.