{"id":16984,"date":"2025-09-04T13:28:31","date_gmt":"2025-09-04T13:28:31","guid":{"rendered":"https:\/\/verdadincomodadiario.ar\/?p=16984"},"modified":"2025-09-04T13:28:31","modified_gmt":"2025-09-04T13:28:31","slug":"como-lograron-manipular-a-chatgpt-con-simples-trucos-psicologicos","status":"publish","type":"post","link":"https:\/\/verdadincomodadiario.ar\/?p=16984","title":{"rendered":"C\u00f3mo lograron manipular a ChatGPT con simples trucos psicol\u00f3gicos"},"content":{"rendered":"<p><strong>Investigadores<\/strong>\u00a0 de la <strong>Universidad de Pennsylvania<\/strong> demostraron que los chatbots de \u00a0<strong><a href=\"https:\/\/derechadiario.com.ar\/sociedad\/sam-altman-admite-los-problemas-chatgpt-5-y-evalua-regreso-gpt-4o\" title=\"Sam Altman admite los problemas en ChatGPT-5 y eval\u00faa el regreso de GPT-4o\"><em>inteligencia artificial<\/em><\/a><\/strong>\u00a0 como <a href=\"https:\/\/derechadiario.com.ar\/sociedad\/openai-cambia-chatgpt-tras-suicidio-adolescente-california\" title=\"OpenAI cambia el ChatGPT tras el suicidio de un adolescente en California\"><strong>ChatGPT<\/strong><\/a> pueden ser convencidos de saltarse sus propias reglas. Usaron estrategias de persuasi\u00f3n basadas en principios psicol\u00f3gicos y obtuvieron resultados sorprendentes.<\/p>\n<p>El trabajo\u00a0plante\u00f3 serias dudas sobre la resiliencia de los filtros de seguridad de los grandes modelos de lenguaje. Incluso un sistema con l\u00edmites dise\u00f1ados para frenar solicitudes riesgosas puede ser manipulado con est\u00edmulos simples.<\/p>\n<div class=\"inter_image image_horizontal\">\n<picture><source class=\"img-responsive\" type=\"image\/webp\" data-srcset=\"https:\/\/filesedc.com\/uploads\/image\/post\/2025\/08\/chatgpt-resumir-textos_300_200.webp 300w, https:\/\/filesedc.com\/uploads\/image\/post\/2025\/08\/chatgpt-resumir-textos_630_420.webp 630w, https:\/\/filesedc.com\/uploads\/image\/post\/2025\/08\/chatgpt-resumir-textos_760_507.webp 760w, https:\/\/filesedc.com\/uploads\/image\/post\/2025\/08\/chatgpt-resumir-textos_1200_800.webp 1200w, https:\/\/filesedc.com\/uploads\/image\/post\/2025\/08\/chatgpt-resumir-textos_1600_1067.webp 1600w, \"><img decoding=\"async\" src=\"https:\/\/derechadiario.com.ar\/filesedc\/uploads\/image\/post\/2025\/08\/chatgpt-resumir-textos_1200_800.webp\" class=\"img-responsive lazyload\" alt=\"Pantalla de inicio de ChatGPT mostrando la secci\u00f3n de capacidades con texto parcialmente visible.\" title=\"Pantalla de inicio de ChatGPT mostrando la secci\u00f3n de capacidades con texto parcialmente visible.\"><\/picture>\n<div>\n<span class=\"img_footer\">El trabajo plante\u00f3 serias dudas sobre la resiliencia de los filtros de seguridad de los grandes modelos de lenguaje <\/span>| <span class=\"img_author\">La Derecha Diario<\/span>\n<\/div>\n<\/div>\n<h2><strong>La psicolog\u00eda detr\u00e1s de los chatbots<\/strong><\/h2>\n<p>Los cient\u00edficos aplicaron siete t\u00e9cnicas de persuasi\u00f3n descritas por el psic\u00f3logo <strong>Robert Cialdini<\/strong> en su libro <em>Influence: The Psychology of Persuasion<\/em>. Entre ellas se encontraban la autoridad, la reciprocidad, el compromiso, la simpat\u00eda y la prueba social.<\/p>\n<p>El efecto de cada t\u00e1ctica depend\u00eda de la consulta. Por ejemplo, cuando se ped\u00eda directamente una receta de <strong>lidoca\u00edna<\/strong>, el chatbot acced\u00eda solo el 1 % de las veces. Sin embargo, si antes se le consultaba por una sustancia como la vainillina, el cumplimiento sub\u00eda al 100 % por el principio de \u201ccompromiso\u201d.<\/p>\n<aside class=\"are-you-interested-container-photo\"><\/aside>\n<h2><strong>C\u00f3mo se lograron las manipulaciones<\/strong><\/h2>\n<p>El mismo patr\u00f3n se repiti\u00f3 con insultos. El modelo casi nunca usaba la palabra \u201cimb\u00e9cil\u201d de manera directa, pero si antes se le ped\u00eda decir \u201cbobo\u201d, la probabilidad de escalar al insulto mayor aumentaba al 100 %.<\/p>\n<figure><img decoding=\"async\" src=\"https:\/\/derechadiario.com.ar\/filesedc\/uploads\/image\/post\/2025\/08\/chatgpt-gratis-prompts_1200_800.webp\" class=\"img-responsive lazyload\" alt=\"Manos escribiendo en un teclado de computadora con una interfaz digital de ChatGPT superpuesta y luz violeta de fondo\" title=\"Manos escribiendo en un teclado de computadora con una interfaz digital de ChatGPT superpuesta y luz violeta de fondo\"><\/figure>\n<p>Tambi\u00e9n se comprob\u00f3 que t\u00e9cnicas como la adulaci\u00f3n o la presi\u00f3n de grupo aumentaban la obediencia. Decirle que \u201cotros modelos de IA ya lo hacen\u201d multiplicaba por 18 la chance de obtener respuestas riesgosas.<\/p>\n<h2><strong>Un problema de seguridad que preocupa<\/strong><\/h2>\n<p>Si bien el estudio se centr\u00f3 en <strong>GPT-4o Mini<\/strong>, sus conclusiones generan dudas sobre la verdadera solidez de las protecciones en inteligencia artificial. Para los autores, que un chatbot pueda ser manipulado con t\u00e1cticas tan b\u00e1sicas muestra que la seguridad sigue siendo fr\u00e1gil.<\/p>\n<aside class=\"whatsappChannelText\"><a href=\"https:\/\/whatsapp.com\/channel\/0029VagEjILGE56eKjedWF2U\" rel=\"nofollow\" title=\"WhatsApp Link\"><img alt=\"Logo de WhatsApp\" class=\"lazyload\" data-src=\"https:\/\/derechadiario.com.ar\/filesedc\/uploads\/other\/whatsapp_icon_mid_article.png\" width=\"32\" height=\"32\"><\/a> <a href=\"https:\/\/whatsapp.com\/channel\/0029VagEjILGE56eKjedWF2U\" rel=\"nofollow\" title=\"WhatsApp Link\"><strong>NO SE PIERDAN NINGUNA NOTICIA<\/strong>: Click aqu\u00ed para sumarte <strong>GRATIS<\/strong> al canal de noticias de <strong>La Derecha Diario en WhatsApp.<\/strong><\/a><\/aside>\n<figure><img decoding=\"async\" src=\"https:\/\/derechadiario.com.ar\/filesedc\/uploads\/image\/post\/2025\/06\/chatgpt_1200_800.webp\" class=\"img-responsive lazyload\" alt=\"Persona sosteniendo un tel\u00e9fono m\u00f3vil que muestra la p\u00e1gina de inicio de ChatGPT en el navegador.\" title=\"Persona sosteniendo un tel\u00e9fono m\u00f3vil que muestra la p\u00e1gina de inicio de ChatGPT en el navegador.\"><\/figure>\n<p>Empresas como <strong>OpenAI<\/strong> y <strong>Meta<\/strong> buscan reforzar constantemente los l\u00edmites de sus sistemas. Aun as\u00ed, los hallazgos revelan que las t\u00e9cnicas humanas de persuasi\u00f3n siguen siendo un desaf\u00edo enorme para la IA.<\/p>\n<h2><strong>M\u00e1s seguridad para menores en ChatGPT<\/strong><\/h2>\n<p>En paralelo, <strong>OpenAI<\/strong> anunci\u00f3 nuevas funciones de control parental en <strong>ChatGPT<\/strong>. Estas permiten a los padres vincular cuentas, restringir accesos y recibir alertas frente a actividades de riesgo. El objetivo es ofrecer un entorno m\u00e1s seguro para adolescentes y ni\u00f1os que usan la plataforma.<\/p>\n<p>Los adultos tambi\u00e9n podr\u00e1n establecer l\u00edmites de tiempo y revisar el historial de interacciones. Con estas medidas, la empresa refuerza su compromiso con la <strong>seguridad digital<\/strong> y la protecci\u00f3n familiar.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Investigadores\u00a0 de la Universidad de Pennsylvania demostraron que los chatbots de \u00a0inteligencia artificial\u00a0 como ChatGPT pueden ser convencidos de saltarse sus propias reglas. Usaron estrategias de persuasi\u00f3n basadas en principios psicol\u00f3gicos y obtuvieron resultados sorprendentes. El trabajo\u00a0plante\u00f3 serias dudas sobre la resiliencia de los filtros de seguridad de los grandes modelos de lenguaje. Incluso un [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":16985,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_et_pb_use_builder":"","_et_pb_old_content":"","_et_gb_content_width":"","footnotes":""},"categories":[84],"tags":[],"class_list":["post-16984","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-ultimomomento"],"_links":{"self":[{"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=\/wp\/v2\/posts\/16984","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=16984"}],"version-history":[{"count":0,"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=\/wp\/v2\/posts\/16984\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=\/wp\/v2\/media\/16985"}],"wp:attachment":[{"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=16984"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=16984"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/verdadincomodadiario.ar\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=16984"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}