Публикации
2025-07-14 11:58 Авторский телеграм-канал Магазин 4.0

Сайты с Jailbreak (методиками взломами ИИ).

Взламываем и защищаемся вместе

Jailbreak стал своего рода видом спорта, есть сообщества и различные сайты, публикации, где публикуется информация.

Я ниже собрал несколько таких публикаций, вы знаете кому это направить.

1️⃣ Метод DAN (https://anakin.ai/blog/chatgpt-jailbreak-prompts/)

2️⃣Метод Best-of-N (BoN) (https://xakep.ru/2024/12/25/best-of-n/)

3️⃣В чём отличие промпт-инъекции отjailbreak(https://learnprompting.org/blog/injection_jailbreaking)

4️⃣Больше способов взлома ИИ (https://learnprompting.org/docs/prompt_hacking/injection)

5️⃣Методики взломов(https://www.confident-ai.com/blog/how-to-jailbreak-llms-one-step-at-a-time)

6️⃣Универсальный способ взлома метод «марионетки» (https://hiddenlayer.com/innovation-hub/novel-universal-bypass-for-all-major-llms/)

7️⃣Как использовать уязвимости обработки естественного языка (NLP). (https://github.com/swisskyrepo/PayloadsAllTheThings/blob/master/Prompt%20Injection/README.md)

8️⃣Как взломать Slack AI (https://www.theregister.com/2024/08/21/slack_ai_prompt_injection/)

9️⃣Пример уязвимости Microsoft Copilot Prompt Injection (https://cybersecuritynews.com/copilot-prompt-injection-vulnerability/)

1️⃣😮Большая статья про разные способы взломов. (https://www.apexhq.ai/blog/blog/prompt-injection-when-ai-goes-rogue/)

1️⃣1️⃣Взлом одной из самых топовых нейросетей (Claude 3.5 Sonnet) для студенческой научной статьи (https://habr.com/ru/articles/864654/)

********

Пригласить Бориса выступить по этой теме http://agatov.pro/

Лень читать, смотри на - YouTube https://www.youtube.com/@agatovboris или RuTube https://rutube.ru/channel/38765038/

Мой курс по ИИ для бизнеса – Курс https://magazin40.getcourse.ru/aicourse