Disfrazados de encuestas

Estamos en una campaña presidencial en la que ya no solo se disputa el poder. También se pelea la percepción de los hechos. La Inteligencia Artificial ha sido una herramienta clave para eso, pero no es la única. Hay otras que también fabrican esa apariencia de realidad: encuestas, que es mejor llamar ejercicios, publicadas en portadas, repetidas en radio, convertidas en tendencia y usadas luego por campañas, bodegas, opinadores y estrategas para decirnos quién “despegó” y quién “se quemó”.

Por eso, esta discusión no es menor. No se trata de si a uno le gusta o no el resultado de una medición. Tampoco de si un candidato sale arriba o abajo. El problema es mucho más serio. Se trata de saber si lo que se está publicando con el título de encuesta cumple realmente con los requisitos técnicos y legales para serlo, o si estamos ante sondeos digitales presentados con máscara de otra cosa.

La diferencia no solo es científica o académica. Es legal. Y desde la Ley 2494 de 2025, llamada por muchos la “ley mordaza”, esa diferencia quedó escrita con todas sus letras. Una encuesta electoral debe basarse en una muestra probabilística, representativa y generalizable. Un sondeo, en cambio, parte de muestras sin base probabilística y, por definición, no permite extrapolar sus resultados de manera representativa al conjunto del electorado. Por esa razón, la misma ley establece que los sondeos de intención de voto no podrán publicarse ni divulgarse. Así de claro y así de sencillo.

Vamos por partes, porque aquí la trampa está en la palabra. Si a una medición digital se le llama “encuesta”, aunque no tenga una muestra probabilística, se le otorga una autoridad que no merece. Se le da apariencia científica, se le asigna un margen de error y un nivel de confianza. El PDF aguanta todo. Y lo que hemos visto es que se le publica una ficha técnica, se le construye un gráfico bonito y con eso basta para convertirlo en verdad pública. Pero una encuesta no es un diseño gráfico con porcentajes. Es un procedimiento técnico verificable. Veamos un caso concreto y sus implicaciones técnicas y legales.

El estudio de la compañía AtlasIntel SAS, publicada por la revista Semana, dice que su metodología se denomina Random Digital Recruitment, o RDR. Según la propia explicación del documento, los encuestados son reclutados aleatoriamente durante su navegación rutinaria en internet, en territorios geolocalizados y desde distintos dispositivos como celulares, tabletas o computadores. También sostiene que sus muestras son “post-estratificadas usando algoritmo iterativo” por sexo, edad, nivel educativo, ingresos, región y comportamiento electoral anterior. No es una encuesta presencial ni telefónica tradicional.

anexo 1 yo

Puede sonar moderno, incluso muy sofisticado. Pero deja sin responder la única pregunta que hace válida una encuesta: ¿qué probabilidad real tenía cada ciudadano de ser seleccionado? Es decir, ¿con qué probabilidad conocida y distinta de cero cada persona del universo pudo ser incluida? Esa es la base estadística de todo. De ahí salen la representatividad, el margen de error y la posibilidad de inferir resultados al país. Si esa probabilidad no es conocida, o no es verificable, o simplemente no existe, no hay diseño probabilístico. Y sin eso, no hay encuesta.

Me explico. Sin marco muestral claro, sin reglas de selección verificables, sin información sobre quién fue invitado, quién respondió y quién quedó por fuera, no hay forma de auditar la muestra. Y sin esa auditoría, no hay diseño probabilístico. Lo que queda es una muestra capturada por un mecanismo digital que puede tener sesgos profundos y, en especial, invisibles.

Esos son los más peligrosos. Corregir edad, sexo o región es relativamente sencillo. Corregir la propensión a responder, la intensidad ideológica, el nivel de interés político o los hábitos de consumo digital es mucho más complejo, porque son factores asociados a sesgos de autoselección y no respuesta. Y, más grave aún, está el problema de cobertura: la exclusión estructural de quienes nunca entraron a la muestra, los que no vieron la invitación, no habitan esos entornos digitales o simplemente no tuvieron ninguna probabilidad de ser alcanzados por el mecanismo de reclutamiento.

El problema no es que sea digital. El problema es que Colombia no lo es del todo. Según la Encuesta de Calidad de Vida 2024 del DANE, solo el 65,6 por ciento de los hogares tiene acceso a internet, y en zonas rurales esa cifra cae a 41,9 por ciento. Incluso el dato más optimista, 77,3 por ciento de personas usuarias, deja por fuera a millones. Esa brecha, territorial, socioeconómica y generacional, no es un detalle, es el país real. Por eso, una encuesta digital solo es válida si demuestra, con total transparencia, cómo corrige esa exclusión estructural. Si no, termina midiendo a los conectados, y no al país.

Sigamos. La ‘posestratificación’ que usa AtlasIntel no es un sustituto de un diseño probabilístico. Es una herramienta. Puede ayudar, ajustar e incluso mejorar una muestra, pero no convierte automáticamente una captura digital opaca en una encuesta probabilística nacional. Dicho de forma más directa: intentar simular una población no es lo mismo que representarla. Y eso es exactamente lo que admite su propia ficha técnica cuando señala que “las muestras resultantes se asemejan al perfil de la población adulta”.

anexo dos yo

Ese es el centro de esta historia. AtlasIntel presenta sus resultados con un margen de error de ±2 puntos porcentuales y un nivel de confianza del 95 por ciento. Pero ese tipo de estimación solo es estadísticamente válida bajo un diseño de muestreo con selección aleatoria, en el que cada unidad del universo tiene una probabilidad conocida de ser incluida y eso permite calcular la variabilidad de las estimaciones. Si la selección de los participantes no responde a ese criterio, o no se demuestra que lo haga, ese margen deja de ser una medida inferencial verificable y pasa a ser una aproximación no sustentada, o una forma elegante de darle precisión a lo que realmente no la tiene. Y eso produce desconfianza del 95 por ciento.

Peor aún. El informe afirma que su margen de error aplica “para todas las preguntas”. Esa afirmación debería encender todas las alarmas. En términos estadísticos, el error de estimación no es uniforme, ya que depende del indicador, del tamaño efectivo de la muestra, de la proporción estimada y del diseño muestral. Además, cuando se analizan cruces o subpoblaciones, la incertidumbre suele aumentar por la reducción del número de observaciones y los efectos del diseño. Por eso, en una medición rigurosa, el margen de error no es un valor único y fijo, sino una estimación que varía según cada resultado. No puede ser un sello universal pegado sobre todo el documento ya que existe un margen de error de diseño, que se calcula antes de recoger la información, y luego está el margen de error encontrado para cada indicador.

Pero AtlasIntel lo usa como anestesia. En su más reciente medición, divulgada el 30 de abril, en la que se afirma que Abelardo de la Espriella le saca casi nueve puntos a Paloma Valencia y que le gana en segunda vuelta a Iván Cepeda, se presenta ese margen de error como universal en una muestra de 4.037 encuestados recogidos en cuatro días. Y listo, eso sería Colombia entera. La realidad, supuestamente, medida y convertida en hecho de portada. Pero no tan rápido.

En otra medición de AtlasIntel del pasado 4 de abril, el propio documento muestra una inconsistencia elemental. En una página habla de 3.616 encuestados, mientras que en la ficha técnica habla de 3.617. Algunos dirán que es apenas una persona o un detalle de digitación. Pero en estadística y matemáticas todo está en la precisión y la atención a las cifras exactas. Si una medición electoral se presenta como un instrumento de exactitud nacional, no puede tener inconsistencias básicas en el número de encuestados.

anexo tres yo

La ciudadanía ve el titular, el gráfico final, pero no el mecanismo que lo produce. Ve la barra azul de un candidato, la naranja del otro, el porcentaje y la flecha que sube o baja. Pero no ve lo esencial: la metodología, el reclutamiento, los rechazos, la depuración, las ponderaciones, el tamaño efectivo de la muestra, las versiones, los microdatos, la cadena de custodia.

Y sin cadena de custodia, una encuesta electoral puede convertirse en propaganda vestida con bata de laboratorio. Eso fue, justamente, lo que hizo tan grave la revelación de Daniel Coronell en su columna del pasado 1° de marzo titulada ‘La encuesta amañada’. Coronell encontró un problema de trazabilidad entre el cuestionario, el informe técnico, el PDF publicado y la portada periodística.

Según su investigación, en una primera versión del PDF divulgada por el medio de comunicación el documento publicado omitía una consulta política en la que estaba Claudia López, presentaba el escenario como si solo existieran dos consultas y atribuía de manera equivocada al Gobierno la convocatoria de una de ellas. Después de sus preguntas, apareció sorpresivamente otro PDF, supuestamente correcto, en el que sí figuraba la tercera consulta. Pero ese nuevo documento no tenía una trazabilidad clara de fecha y hora de creación o modificación.

La cosa fue más lejos. La propia revista Semana reconoció que algunos porcentajes publicados en portada no salían directamente del informe técnico de AtlasIntel, sino de cálculos hechos por ellos mismos a partir de números absolutos. Es decir, una medición presentada al país como encuesta terminó convertida en noticia con cifras procesadas editorialmente por el medio. Grave.

Eso produjo la portada que daba por hecho el fracaso de las consultas, que anticipaba una baja participación y un desinterés generalizado. Nada más equivocado. La realidad fue que las tres consultas movilizaron más de 9 millones de votos y reconfiguraron el mapa político. La distancia entre lo que se proyectó en portada y lo que ocurrió en las urnas no fue menor. Y cuando esa distancia se construye sobre mediciones procesadas fuera del informe técnico, el problema deja de ser de visión editorial.

anexo cuatro yo

Porque una encuesta electoral no es plastilina para moldear una noticia más atractiva. No es materia prima para operaciones editoriales que terminan en titulares, o una mercancía política que se recalcula en la sala de redacción.

Y aquí la defensa usual de la compañía tampoco sirve. Establecer que la casa matriz de AtlasIntel ha acertado en otros países no resuelve el problema colombiano. Puede haber sido precisa en Estados Unidos, Brasil, Argentina o Chile. Puede tener reconocimientos internacionales o mostrar rankings, sellos, trayectorias y capturas de medios extranjeros. De hecho, el propio informe dedica varias páginas a autoexaltar su desempeño y reputación internacional. Pero eso no reemplaza el cumplimiento de la ley, y un historial de aciertos tampoco convierte una metodología en probabilística por decreto.

De hecho, en el Mundial de Fútbol de 2010, el pulpo Paul “acertó” el 100 por ciento de sus “predicciones”, y nadie diría que fue producto de un ejercicio probabilístico, sino que implemente fue uno de los miles de fenómenos del azar. La pregunta no es si AtlasIntel ha acertado antes, sino si esta medición cumple la ley colombiana y la ciencia estadística, y esa respuesta no se hace con prestigio, se contesta con datos.

La regulación no dice que se pueden publicar sondeos si la firma es famosa o que se pueden omitir requisitos si la empresa tiene buena reputación. No dice que el margen de error se presume válido si la encuestadora ha salido en medios internacionales. La ley exige condiciones objetivas y si esas condiciones no se cumplen, lo publicado no puede circular como encuesta electoral.

En esto es preciso aclarar que la Ley 2494 fue criticada por muchos, y con razón, porque terminó afectando la circulación de información electoral. Hoy en día tenemos menos encuestas y menos datos. Hay argumentos legítimos contra la ley, pero mientras esté vigente, no puede aplicarse de manera selectiva. No puede convertirse en una norma dura para unas firmas y flexible para otras. Si la ley existe, se aplica y si no sirve, se reforma, pero no se ignora.

Eso es lo que debe investigar el Consejo Nacional Electoral (CNE). No con comunicados preventivos con pinta de rígidos, como el que sacó el pasado 14 de abril. Su entrada fue clara: “El CNE, a través de la Comisión Técnica y de Vigilancia de Encuestas sobre Opinión Política y Electoral, informa a la opinión pública que ha identificado deficiencias metodológicas relevantes en estudios de opinión difundidos como encuestas electorales en el país, lo cual representa un riesgo para la transparencia del proceso democrático y la adecuada formación de la opinión ciudadana”.

Después dijo: “las deficiencias identificadas por el CNE se concentran en aspectos esenciales como el diseño muestral, la cobertura del universo electoral, la validez de las inferencias estadísticas y el uso inadecuado de técnicas de ajuste. Estas falencias comprometen la representatividad y la capacidad de generalización de los resultados, elementos indispensables para que un estudio pueda ser considerado una encuesta electoral válida”.

Pero el CNE decidió rematar con una frase que es casi una confesión: “el presente comunicado tiene carácter preventivo”. Es decir, se identifica la violación de la ley y, aun así, no hay consecuencias. Ese tipo de actuaciones revela algo más profundo, y es que, para el CNE, la norma termina siendo una referencia y no una obligación. Sus oficios se vuelven decorativos, atrapados en una prudencia burocrática que, en Colombia, suele leerse como lo que es: permiso para que todo siga igual.

anexo cinco yo

La ley es para cumplirla. En especial porque las mediciones, en general, no son inofensivas. Calculan elementos esenciales como los cambios de opinión, revelan tendencias, ayudan a entender el ánimo ciudadano y permiten discutir con datos. Además, abren puertas de financiación, convencen donantes indecisos en el último kilómetro, arrastran alianzas y cambian el tono de una campaña. Pueden generar la sensación de que alguien ya está en segunda vuelta, malherir candidaturas antes de la elección y fabricar una sensación de inevitabilidad. También pueden producir miedo, empujar al voto útil y terminar sembrando resignación o esperanza.

Cuando eso se hace con una aproximación que demuestra no ser probabilística, el daño democrático es enorme. Por eso hay que defender las encuestas de sus imitaciones. El problema no son las mediciones, sino los sondeos disfrazados de encuestas. El CNE tiene una prueba institucional y es demostrar si está para hacer cumplir la ley o simplemente para tomarla como sugerencia.

@yohirakerman; akermancolumnista@gmail.com