Взламываем и защищаемся вместе
Jailbreak стал своего рода видом спорта, есть сообщества и различные сайты, публикации, где публикуется информация.
Я ниже собрал несколько таких публикаций, вы знаете кому это направить.
1️⃣ Метод DAN (https://anakin.ai/blog/chatgpt-jailbreak-prompts/)
2️⃣Метод Best-of-N (BoN) (https://xakep.ru/2024/12/25/best-of-n/)
3️⃣В чём отличие промпт-инъекции отjailbreak(https://learnprompting.org/blog/injection_jailbreaking)
4️⃣Больше способов взлома ИИ (https://learnprompting.org/docs/prompt_hacking/injection)
5️⃣Методики взломов(https://www.confident-ai.com/blog/how-to-jailbreak-llms-one-step-at-a-time)
6️⃣Универсальный способ взлома метод «марионетки» (https://hiddenlayer.com/innovation-hub/novel-universal-bypass-for-all-major-llms/)
7️⃣Как использовать уязвимости обработки естественного языка (NLP). (https://github.com/swisskyrepo/PayloadsAllTheThings/blob/master/Prompt%20Injection/README.md)
8️⃣Как взломать Slack AI (https://www.theregister.com/2024/08/21/slack_ai_prompt_injection/)
9️⃣Пример уязвимости Microsoft Copilot Prompt Injection (https://cybersecuritynews.com/copilot-prompt-injection-vulnerability/)
1️⃣😮Большая статья про разные способы взломов. (https://www.apexhq.ai/blog/blog/prompt-injection-when-ai-goes-rogue/)
1️⃣1️⃣Взлом одной из самых топовых нейросетей (Claude 3.5 Sonnet) для студенческой научной статьи (https://habr.com/ru/articles/864654/)
********
Пригласить Бориса выступить по этой теме http://agatov.pro/
Лень читать, смотри на - YouTube https://www.youtube.com/@agatovboris или RuTube https://rutube.ru/channel/38765038/
Мой курс по ИИ для бизнеса – Курс https://magazin40.getcourse.ru/aicourse
Jailbreak стал своего рода видом спорта, есть сообщества и различные сайты, публикации, где публикуется информация.
Я ниже собрал несколько таких публикаций, вы знаете кому это направить.
1️⃣ Метод DAN (https://anakin.ai/blog/chatgpt-jailbreak-prompts/)
2️⃣Метод Best-of-N (BoN) (https://xakep.ru/2024/12/25/best-of-n/)
3️⃣В чём отличие промпт-инъекции отjailbreak(https://learnprompting.org/blog/injection_jailbreaking)
4️⃣Больше способов взлома ИИ (https://learnprompting.org/docs/prompt_hacking/injection)
5️⃣Методики взломов(https://www.confident-ai.com/blog/how-to-jailbreak-llms-one-step-at-a-time)
6️⃣Универсальный способ взлома метод «марионетки» (https://hiddenlayer.com/innovation-hub/novel-universal-bypass-for-all-major-llms/)
7️⃣Как использовать уязвимости обработки естественного языка (NLP). (https://github.com/swisskyrepo/PayloadsAllTheThings/blob/master/Prompt%20Injection/README.md)
8️⃣Как взломать Slack AI (https://www.theregister.com/2024/08/21/slack_ai_prompt_injection/)
9️⃣Пример уязвимости Microsoft Copilot Prompt Injection (https://cybersecuritynews.com/copilot-prompt-injection-vulnerability/)
1️⃣😮Большая статья про разные способы взломов. (https://www.apexhq.ai/blog/blog/prompt-injection-when-ai-goes-rogue/)
1️⃣1️⃣Взлом одной из самых топовых нейросетей (Claude 3.5 Sonnet) для студенческой научной статьи (https://habr.com/ru/articles/864654/)
********
Пригласить Бориса выступить по этой теме http://agatov.pro/
Лень читать, смотри на - YouTube https://www.youtube.com/@agatovboris или RuTube https://rutube.ru/channel/38765038/
Мой курс по ИИ для бизнеса – Курс https://magazin40.getcourse.ru/aicourse