Análisis Semántico–Matemático del Artículo

📖 Guía Completa de Indicadores y Métricas

Este dashboard analiza múltiples dimensiones del texto para detectar patrones de sesgo. A continuación se explica cada métrica y su significado.

📚 Métricas Léxico-Estadísticas

Diversidad Léxica

Qué mide: Proporción de palabras únicas respecto al total.
Interpretación:
• Alto (>0.60): Vocabulario rico y variado
• Medio (0.40-0.60): Vocabulario estándar
• Bajo (<0.40): Repetitivo, vocabulario limitado

Frecuencia de Términos (TF)

Qué mide: Palabras más repetidas en el texto.
Utilidad: Identifica conceptos centrales y posibles énfasis intencionales. Repetición excesiva puede indicar machaque discursivo.

TF-IDF (Relevancia)

Qué mide: Palabras distintivas vs. un corpus de referencia.
Utilidad: Identifica términos que definen la temática específica del artículo, más allá de palabras comunes.

Complejidad Sintáctica

Qué mide: Promedio de palabras por oración.
Interpretación:
• >25 palabras: Sintaxis compleja, difícil comprensión
• 15-25: Complejidad moderada
• <15: Texto sencillo y directo

🧠 Análisis Semántico y Coherencia

Coherencia Semántica

/ 1.0

Consistencia temática entre segmentos. Alto (>0,75): cohesivo · Bajo (<0,50): saltos temáticos.

Detección de Reframing

Requiere NLP — no disponible

Detectar parafraseo de la misma idea exige similitud semántica (embeddings); no se puede medir de forma fiable con conteo de palabras.

Entropía Léxica

bits

Imprevisibilidad del vocabulario (Shannon). Mayor = más diverso. La barra muestra la eficiencia respecto al máximo posible ().

💭 Análisis de Sentimiento y Tono Emocional

Polaridad Emocional

Qué mide: Tono afectivo en escala -1 (muy negativo) a +1 (muy positivo).
Interpretación:
• Cercano a 0: Neutral y equilibrado
• >0.5 o <-0.5: Fuerte carga emocional

Distribución Emocional

Qué mide: Porcentaje de segmentos positivos, neutrales y negativos.
Utilidad: Revela el balance emocional general. Textos objetivos mantienen alto porcentaje de tono neutral.

Evolución del Sentimiento

Qué mide: Cambios en el tono emocional a lo largo del texto.
Utilidad: Detecta narrativas que inician neutrales y gradualmente cargan el discurso emocionalmente.

Intensidad Emocional

Qué mide: Magnitud de la carga afectiva (independiente de dirección).
Interpretación: Textos altamente emocionales pueden carecer de objetividad, incluso si no son claramente positivos o negativos.

🗣️ Análisis Discursivo y Pragmático

Actores y Roles Discursivos

Requiere NLP — no disponible

Identificar entidades y su rol (agente/paciente) exige reconocimiento de entidades y análisis sintáctico de dependencias; no es fiable sin NLP.

Voz Activa vs Pasiva

% pasiva

Pasiva (oculta responsabilidad) · Activa. Estimación por patrones.

Modalidad del Lenguaje

marcadores
Certeza: («sin duda», «evidente»)
Probabilidad: («quizás», «posiblemente»)
Opinión: («se considera», «se cree»)

Afirmaciones vs Evidencias

ev./afirm.
Afirmaciones (oraciones):
Evidencias (referencias):

Pocas evidencias por afirmación = más aseveraciones sin respaldo.

⚠️ Indicadores Específicos de Sesgo

1. Sesgo de Polaridad Emocional

Qué detecta: Desequilibrio sistemático hacia sentimientos positivos o negativos.
Cálculo: Desviación de la neutralidad emocional (0).
Ejemplo: Artículo que describe todos los logros del gobierno con lenguaje positivo y todas las acciones de la oposición con lenguaje negativo.

2. Sesgo de Encuadre (Framing)

Qué detecta: Selección de marcos interpretativos que favorecen narrativas específicas.
Ejemplos clásicos:
• "Luchador por la libertad" vs "Insurgente"
• "Recortes" vs "Ajustes necesarios"
• "Invasión" vs "Intervención humanitaria"
Importancia: El framing determina cómo el lector interpreta los hechos.

3. Sesgo de Omisión Temática

Qué detecta: Ausencia deliberada o inconsciente de perspectivas relevantes.
Método: Compara con corpus de referencia sobre el mismo tema.
Ejemplo: Artículo sobre política económica que omite completamente el impacto social o solo presenta la visión oficial sin críticas.

4. Sesgo de Intensidad Discursiva

Qué detecta: Uso frecuente de lenguaje intensificador y cargado.
Indicadores:
• Intensificadores: "extremadamente", "totalmente", "absolutamente"
• Hipérboles: "catástrofe", "desastre total", "triunfo histórico"
• Lenguaje alarmista o eufórico
Impacto: Amplifica subjetividad y reduce objetividad.

5. Sesgo de Autoridad y Legitimación

Qué detecta: Desequilibrio en la selección, frecuencia y presentación de fuentes.
Preguntas clave:
• ¿Todas las voces tienen igual espacio?
• ¿Se privilegian fuentes oficiales sobre independientes?
• ¿Se descalifican unas fuentes mientras se elevan otras?
Métrica: Ratio y tratamiento diferencial entre fuentes citadas.

6. Sesgo de Atribución de Responsabilidad

Qué detecta: Asimetría en cómo se atribuye responsabilidad, mérito o culpa.
Mecanismos sintácticos:
• Voz activa para méritos: "El presidente logró..."
• Voz pasiva para errores: "Se produjeron fallas..."
• Atribución externa: "La crisis causó..." vs "El gobierno causó..."
Efecto: Manipula la percepción de quién es responsable de qué.

📑 Análisis de Referencias y Fuentes

Ratio de Fuentes

Qué mide: Proporción de afirmaciones respaldadas por fuentes identificables.
Estándares:
• Periodismo riguroso: >0.30
• Análisis informado: 0.15-0.30
• Opinión/Editorial: <0.15

Diversidad de Fuentes

Qué evalúa: Variedad y pluralidad de perspectivas citadas.
Señales de sesgo:
• Dependencia excesiva de fuentes oficiales
• Ausencia de voces críticas o alternativas
• Concentración en pocas fuentes

Calidad de Atribución

Qué analiza: Claridad y especificidad en la identificación de fuentes.
Escalas:
• Alta: Nombres, cargos, instituciones específicas
• Media: "Fuentes oficiales", "Expertos"
• Baja: "Se dice", "Algunos consideran" (fuentes anónimas genéricas)

Balance de Perspectivas

Qué mide: Equidad en el espacio y tratamiento de diferentes posiciones.
Indicadores:
• Número de citas por perspectiva
• Longitud de las citas
• Ubicación (inicio vs final del artículo)
• Contexto (antes/después de afirmaciones positivas/negativas)

📊 Interpretación del Índice Global de Sesgo

0.00 - 0.20 MUY BAJO

Texto altamente neutral y equilibrado. Cumple estándares rigurosos de objetividad periodística.

0.21 - 0.40 BAJO

Sesgo mínimo, dentro de rangos aceptables. El texto mantiene balance general.

0.41 - 0.60 MODERADO

Presencia notable de indicadores de sesgo. Requiere atención y revisión editorial.

0.61 - 0.80 ALTO

Sesgo significativo que compromete la objetividad. Necesita corrección sustancial.

0.81 - 1.00 MUY ALTO

Sesgo extremo. El texto tiene características de contenido propagandístico o advocacy.

⚠️ Nota Metodológica Importante: Este sistema utiliza procesamiento de lenguaje natural y métricas estadísticas para cuantificar aspectos del discurso. Los resultados son indicadores complementarios que DEBEN ser interpretados por analistas humanos con conocimiento del contexto sociopolítico, cultural e histórico. La tecnología detecta patrones, pero solo el juicio experto puede determinar intencionalidad, contexto apropiado y significado final. No use estos resultados como veredictos absolutos.

Resumen del Análisis

Título -
Fuente -
Fecha de análisis -
Palabras totales -
Palabras únicas -
Oraciones -
Índice de sesgo -

Métricas Principales

Diversidad Léxica
-
Ratio único/total
Polaridad Emocional
-
Escala -1 a +1
Coherencia Semántica
-
Similaridad media
Complejidad
-
Palabras/oración

3. Análisis Léxico–Estadístico

3.1 Frecuencia de términos

Top 15 Términos más Frecuentes

3.2 Términos relevantes

Palabras Clave del Texto

5. Análisis de Sentimiento y Tono

5.1 Distribución de sentimientos

Análisis de Polaridad

5.2 Balance de polaridad

Entre las pocas palabras que llevan carga emocional, ¿qué proporción es positiva y cuál negativa? Esto ignora el texto neutro y muestra el desbalance del tono.

Balance de Polaridad (solo palabras con carga)

5.4 Evolución del sentimiento

Progresión Emocional del Texto

7. Indicadores de Sesgo

¿Cómo se calcula el índice de sesgo?

Basado en el modelo de Recasens, Danescu-Niculescu-Mizil & Jurafsky (2013, ACL), validado sobre ediciones reales de Wikipedia que eliminan sesgo (corpus NPOV). El cálculo es determinista: el mismo texto siempre da el mismo resultado.

  1. Se cuentan las palabras de cada una de 6 categorías lingüísticas de sesgo.
  2. Por categoría: densidad = nº señales / total palabras, saturada al 5%.
  3. Cada categoría se pondera por su peso empírico (frecuencia real en el corpus NPOV).
  4. Índice global = suma ponderada (rango 0 a 1).
CategoríaClasePeso
Términos unilaterales / cargadosEncuadre38%
Entailments / verbos implicativosEpistemológico25%
Intensificadores subjetivosEncuadre19%
Verbos asertivosEpistemológico11%
Atenuadores (hedges)Epistemológico4%
Verbos factivosEpistemológico3%

Umbrales: índice ≤ 0,40 BAJO · 0,40–0,60 MODERADO · > 0,60 ALTO. Nota: las categorías y pesos provienen del paper (en inglés); los léxicos en español son una adaptación.

Indicador Valor Nivel Descripción
Radar de Sesgos Detectados

8. Análisis de Referencias y Fuentes

El análisis de referencias evalúa la calidad y equilibrio de las fuentes utilizadas en el texto, un factor crucial para determinar la objetividad periodística.

Ratio de Fuentes
-
Referencias por párrafo
Diversidad de Fuentes
-
Tipos distintos
Calidad Atribución
-
Escala 0-1
Balance Perspectivas
-
Equidad de voces
Distribución de Tipos de Fuentes

8.1 Evaluación de Calidad de Referencias

Métrica Valor Evaluación Observaciones
Balance entre Perspectivas

9. Índice Global de Sesgo

Índice Global de Sesgo

Conclusiones del Análisis