Abres un archivo en Excel y donde debería decir “González” dice “González”. Donde debería haber una ñ hay un símbolo extraño. Los guiones largos se convirtieron en —. Y cada tilde se transformó en una combinación de caracteres que no tiene sentido.
No es que alguien haya escrito mal. Es un problema de encoding — el archivo fue guardado en un formato y Excel lo está leyendo en otro. Es como intentar leer un libro en español con un diccionario de francés. Las letras están ahí, pero la interpretación es incorrecta.
Esto pasa constantemente cuando trabajas con datos de diferentes fuentes. Un sistema exporta en UTF-8, otro en Latin-1, otro en Windows-1252. Excel asume uno y si no coincide, aparecen los caracteres raros.
Por qué pasa (sin tecnicismos)
Cada archivo de texto tiene un “idioma” interno que le dice al programa cómo interpretar los caracteres. Los más comunes son:
- UTF-8 — el estándar moderno. Maneja todos los caracteres del mundo: ñ, é, ü, 中文, العربية
- Latin-1 (ISO-8859-1) — el viejo estándar europeo. Maneja español y francés pero no todo lo demás
- Windows-1252 — la versión de Microsoft de Latin-1. Casi igual pero no idéntico
Cuando un archivo UTF-8 se abre como si fuera Latin-1 (o al revés), los caracteres especiales se rompen. Es el origen del 90% de los “caracteres raros” que ves en Excel.
Método 1: Importar con el encoding correcto
En vez de abrir el archivo directamente (doble click), impórtalo:
- Abre Excel con una hoja en blanco
- Ve a Datos → Obtener datos → De un archivo → De texto/CSV
- Selecciona tu archivo
- En la ventana de preview, busca el selector de Origen del archivo o Encoding
- Cambia a 65001: Unicode (UTF-8)
- Verifica en el preview que los caracteres se ven bien
- Click en Cargar
Si UTF-8 no funciona, prueba con 1252: Western European (Windows) o 28591: Latin-1.
El problema: tienes que saber qué encoding tiene el archivo. Y si el archivo ya tiene mezcla de encodings (parte UTF-8, parte Latin-1 — pasa más de lo que crees), este método no lo resuelve.
Método 2: Buscar y reemplazar los caracteres rotos
Si ya tienes el archivo abierto y los caracteres están rotos, puedes reemplazarlos manualmente:
- Ctrl+H (Buscar y reemplazar)
- Buscar:
á→ Reemplazar con:á - Buscar:
é→ Reemplazar con:é - Buscar:
Ã→ Reemplazar con:í - Buscar:
ó→ Reemplazar con:ó - Buscar:
ú→ Reemplazar con:ú - Buscar:
ñ→ Reemplazar con:ñ - Buscar:
ü→ Reemplazar con:ü
El problema: hay decenas de combinaciones posibles. Los que listé arriba son solo los más comunes en español. Si tienes datos en portugués, francés, o alemán, la lista crece exponencialmente. Y hacerlo manualmente en un archivo de 10,000 filas es un trabajo que no deberías estar haciendo.
Método 3: Usar una herramienta que detecte y arregle el encoding
Lo que necesitas es algo que:
- Detecte automáticamente el encoding del archivo
- Identifique caracteres rotos y los corrija
- Maneje archivos con encoding mixto (sí, eso existe y es un infierno)
- No destruya datos en el proceso
Data Cleaner hace exactamente esto. Subes tu archivo, detecta el encoding, corrige los caracteres, y descargas el archivo limpio. Sin instalar nada — tu archivo ni siquiera sale de tu computadora. Gratis.
Los reemplazos más comunes
Si necesitas arreglar esto ahora mismo con buscar y reemplazar, aquí van los patrones más frecuentes cuando un archivo UTF-8 se lee como Latin-1:
| Ves esto | Debería ser | Carácter |
|---|---|---|
| á | á | a con tilde |
| é | é | e con tilde |
| Ã | í | i con tilde |
| ó | ó | o con tilde |
| ú | ú | u con tilde |
| ñ | ñ | eñe |
| ü | ü | u con diéresis |
| Ã | Á | A con tilde |
| – | — | guión largo |
| ’ | ‘ | apóstrofe |
| “ | ” | comillas abrir |
| †| “ | comillas cerrar |
Guarda esta tabla. La vas a necesitar más de una vez.
Un dato que probablemente no sabías
El 80% de los problemas de encoding en Excel vienen de una sola situación: alguien exportó datos de un sistema web (que usa UTF-8) y los abrió en Excel directamente (que asume Windows-1252 en muchos casos). No es un error del usuario — es Excel tomando una decisión por ti sin preguntarte.
La solución de fondo es que los archivos se abran siempre con el encoding correcto. Pero mientras Excel siga asumiendo, vas a seguir necesitando una forma de arreglarlo después.