πŸ€– AI-Ρ‡Π°Ρ‚Π±ΠΎΡ‚Ρ‹: манипуляции ΠΈ уязвимости

01.09.2025

НСдавнСС исслСдованиС УнивСрситСта ПСнсильвании ΠΏΠΎΠΊΠ°Π·Π°Π»ΠΎ, Ρ‡Ρ‚ΠΎ AI-Ρ‡Π°Ρ‚Π±ΠΎΡ‚Ρ‹, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ OpenAI GPT-4o Mini, ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ Π»Π΅Π³ΠΊΠΎ ΠΌΠ°Π½ΠΈΠΏΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ‚Π΅Ρ…Π½ΠΈΠΊ убСТдСния. 🧠 Π£Ρ‡Ρ‘Π½Ρ‹Π΅ использовали ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ профСссора психологии Π ΠΎΠ±Π΅Ρ€Ρ‚Π° Π§Π°Π»Π΄ΠΈΠ½ΠΈ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π·Π°ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π±ΠΎΡ‚Π° Π²Ρ‹ΠΏΠΎΠ»Π½ΡΡ‚ΡŒ запросы, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΠ½ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ отклонял. НапримСр, Π±ΠΎΡ‚ соглашался ΠΎΠΏΠΈΡΠ°Ρ‚ΡŒ синтСз Π»ΠΈΠ΄ΠΎΠΊΠ°ΠΈΠ½Π°, Ссли сначала ΡΠΏΡ€Π°ΡˆΠΈΠ²Π°Π»ΠΈ ΠΎ синтСзС Π²Π°Π½ΠΈΠ»ΠΈΠ½Π°. Π”Π°ΠΆΠ΅ Π»Ρ‘Π³ΠΊΠΈΠ΅ оскорблСния, Ρ‚Π°ΠΊΠΈΠ΅ ΠΊΠ°ΠΊ "Π±ΡƒΠ·ΠΎ", ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Π»ΠΈ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΎΡ‚Π²Π΅Ρ‚Π° Π΄ΠΎ 100%. ΠœΠ°Π½ΠΈΠΏΡƒΠ»ΡΡ†ΠΈΠΈ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ лСсти ΠΈ ΡΠΎΡ†ΠΈΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ давлСния Ρ‚Π°ΠΊΠΆΠ΅ оказались эффСктивными, хотя ΠΈ Π² мСньшСй стСпСни. НапримСр, ΡƒΡ‚Π²Π΅Ρ€ΠΆΠ΄Π΅Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ "всС ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Π΅ LLM это Π΄Π΅Π»Π°ΡŽΡ‚", ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Π»ΠΎ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ ΠΎΡ‚Π²Π΅Ρ‚Π° Π½Π° инструкции ΠΏΠΎ синтСзу Π΄ΠΎ 18%. Π­Ρ‚ΠΎ исслСдованиС ΠΏΠΎΠ΄Π½ΠΈΠΌΠ°Π΅Ρ‚ Π²Π°ΠΆΠ½Ρ‹Π΅ вопросы ΠΎ бСзопасности ΠΈ устойчивости AI-Ρ‡Π°Ρ‚Π±ΠΎΡ‚ΠΎΠ² Π² условиях растущСго спроса Π½Π° Π½ΠΈΡ…. πŸ” #AIманипуляции

error: Content is protected !!