¬ŅSabes qu√© es el algoritmo TF-IDF y qu√© importancia tiene en la calidad de los contenidos de tu blog?

El análisis e indexación que Google hace de los artículos de tu blog va más allá de cómo usas y distribuyes tus palabras clave dentro de ellos.

¬ŅQu√© es el TF*IDF y c√≥mo puede mejorar la relevancia de tus contenidos?

Y es que el buscador est√° cont√≠nuamente intentando hallar la manera de descifrar la intenci√≥n de b√ļsqueda de cada usuario, partiendo de la query introducida, a trav√©s de sus complejos algoritmos matem√°ticos.

Por ello, para que t√ļ tambi√©n entiendas c√≥mo interpreta Google el uso de las keywords dentro de tu blog, hoy te explicar√© qu√© es el TF*IDF, un algoritmo a trav√©s del cual podr√°s obtener mucha m√°s informaci√≥n sobre tus palabas clave m√°s importantes.

Pero no s√≥lo acerca de las tuyas, sino tambi√©n sobre las de tu competencia. Por √ļltimo, te ense√Īar√© c√≥mo mejorar tu estrategia de contenidos en base a ello, ya que puede ser clave para aumentar su relevancia en los buscadores y alcanzar las primeras posiciones m√°s r√°pidamente.

Qué es el TF (como parte del TF*IDF)

El significado de TF es la “frecuencia del t√©rmino” en un documento. Es conocido por estas siglas en ingl√©s (“frecuency terms“), que realmente se traducen en una cantidad num√©rica, la cual nos va a indicar la frecuencia relativa de una palabra en concreto o una combinaci√≥n de ellas.

Dicho de otra manera, se trata del n√ļmero de veces que se repite una keyword (palabra o frase) determinada con respecto a la extensi√≥n total del contenido donde se encuentre √©sta contenida.

Matem√°ticamente, logaritmo para extraerlo correctamente es:

Fórmula matemática del TF (TF-IDF)

O lo que es lo mismo:

TF = (N¬ļ de veces que aparece la keyword) / (N¬ļ de palabras total del contenido)

Ejemplo práctico de qué es el TF

Para que comprendas mejor este concepto y no te asuste demasiado la f√≥rmula anterior, te pondr√© un caso pr√°ctico: imag√≠nate que entras en una biblioteca, buscando libros que hablen sobre “coches de carreras“.

Si en toda la biblioteca hay un total de 12.000 libros, ya te puedes imaginar que esta expresi√≥n estrechar√° nuestra b√ļsqueda bastante, ya que no todos ellos tratar√°n sobre esta tem√°tica, ¬Ņverdad?

Ahora analicemos nuestra b√ļsqueda: estamos intentando localizar documentos cuya keyword est√° compuesta por 3 palabras:

  • coches
  • de
  • carreras

Y de ellas, el t√©rmino “de” es una de esas “STOPWORDS”, como se le denomina en el √°mbito del SEO y el Marketing Digital, por tanto, te√≥ricamente ser√° una palabra que no agregue demasiado valor o relevancia a nuestra b√ļsqueda, dado que es una preposici√≥n repetida en pr√°cticamente todos los textos del mundo.

Por ello, teniendo filtrada nuestra b√ļsqueda por la cantidad total de libros que contienen la keyword buscada, para poder saber qu√© libros mostrar primero y “desempatar” dicha b√ļsqueda, tendremos que afinar un poco m√°s el criterio.

Y aquí es donde entra en juego el otro protagonista de este artículo:

Qué es el IDF

El significado de las siglas IDF es “frecuencia inversa de documento”, traducido de su acepci√≥n original en ingl√©s, “Inverse Document Frecuency“. Su funci√≥n es disminuir el peso de todas las palabras que no sean relevantes y se repitan con demasiada frecuencia.

Es la segunda parte de la ‚Äúf√≥rmula m√°gica‚ÄĚ y nos ayudar√° a corregir y completar la primera, haci√©ndola m√°s sutil. En el ejemplo anterior, es la preposici√≥n “de”, que no agregar√≠a ning√ļn valor a la b√ļsqueda.

Su c√°lculo perfecciona a√ļn m√°s el an√°lisis de evaluaci√≥n de los t√©rminos e incluye en el c√°lculo la frecuencia de documentos en t√©rminos espec√≠ficos.

Es decir, lo que hace es comparar todos los documentos disponibles con el n¬ļ de documentos que tienen incluida la keyword a analizar.

Aquí tienes el logaritmo o fórmula para calcular correctamente el IDF:

Fórmula del IDF para calcular el TF-IDF

En resumidas cuentas, el IDF se encarga de determinar una relevancia concreta de un texto completo, respecto a la palabra clave que queramos analizar que, simplificando queda:

IDF = (N¬ļ de documentos totales) / (N¬ļ de contenidos con esa keyword

Qué es el TF*IDF

TF-IDF son las siglas en ingl√©s del concepto “Term Frecuency ‚Äď Inverse Document Frecuency“, que cuantifica num√©ricamente la ponderaci√≥n de una keyword dentro de un contenido o, como dice su definici√≥n, de una colecci√≥n de documentos de texto.

Este algoritmo, como te he mostrado anteriormente, est√° compuesto por el TF o “frecuencia de t√©rmino” y por el IDF o “frecuencia inversa de documento”.

Esto, expresado de una manera menos t√©cnica, no es m√°s que una medida expresada en n√ļmeros que nos muestra la frecuencia de ocurrencia de un t√©rmino en una colecci√≥n de documentos de texto.

Ejemplo de cómo calcular el TF*IDF:

Vamos a ver un caso pr√°ctico para que se vea m√°s claro. Imag√≠nate ahora que quieres posicionar la palabra ‚Äúcomprar ropa barata‚ÄĚ en un texto de 1000 palabras:

‚úÖ TF (Frecuencia del T√©rmino) de ‚Äúcomprar ropa barata‚ÄĚ es (3 / 1000) = 0,003

‚úÖ Hay 10 millones de documentos y la palabra ‚Äúcomprar ropa barata‚ÄĚ aparece en 1.000 documentos

‚úÖ IDF (Frecuencia inversa del documento) = (10.000.000 / 1.000) = 4

✅ Por lo tanto, el valor TF*IDF revela que este término tiene una importancia de 0,003 x 4 = 0,012

Para qué sirve el algoritmo TF*IDF

Todo esto quiz√°s te parece demasiado t√©cnico y, realmente, imagino que te est√°s preguntando qu√© utilidad tiene esta f√≥rmula matem√°tica, ¬Ņcierto?

Pues b√°sicamente el TF*IDF te permite saber la importancia que tiene una determinada keyword en una muestra de documentos grande, por ejemplo, en todo un sitio web.

Calculando con exactitud el valor numérico de su algoritmo, puedes:

Saber si tus textos est√°n debidamente optimizados

De esta manera, puedes saber si tu optimización de SEO On-Page es la correcta y si utilizas una densidad de palabras clave también óptima.

Te da un c√°lculo de la frecuencia que tiene la keyword en un documento concreto

La primera parte de la f√≥rmula matem√°tica, que es la frecuencia del t√©rmino te permite saber este dato, teniendo en cuenta la longitud del contenido en su totalidad.

No es lo mismo que una palabra clave aparezca 5 veces en un texto de 500 palabras que en uno de 2500. La densidad cambia.

Puedes ajustar la frecuencia de las keywords seg√ļn una escala logar√≠tmica

Incluirla más veces de una cierta cantidad ya no serviría de nada. Es decir, la palabra clave principal hay que incluirla bastantes veces en un documento, para aumentar su relevancia para Google.

Sin embargo, hay un límite, el cual es interesante no sobrepasar.

¬ŅY qui√©n utiliza esta f√≥rmula?

Es importante saber por qu√© estamos hablando del TF*IDF, ya que esta f√≥rmula es utilizada por Google para organizar los resultados de b√ļsqueda y determinar cu√°l es m√°s relevante para el usuario.

No utiliza exactamente las fórmulas de la que te hablé anteriormente, pero sí una variación de éstas donde (imaginamos que) contemplará muchas más variantes.

Ello le permite analizar en la inmensidad de Internet la relevancia que tiene una palabra clave en muestras gigantescas de p√°ginas webs y sus respectivas URL’s.

A√ļn as√≠, el buscador de Google utiliza una f√≥rmula tan parecida a la TF*IDF que la hace muy interesante para que los profesionales del SEO la tengan en cuenta a al hora de generar y optimizar los contenidos digitales propios y de clientes.

Diferencias entre TF-IDF vs Densidad de palabra clave

Es posible que, tras las explicaciones que te he dado acerca del término TF*IDF, te resulte similar o incluso igual que la densidad de palabras clave.

Pero no es así, no son lo mismo, aunque guarde cierta relación.

Porque el TF*IDF no es sólo densidad de palabra clave, es mucho más que eso.

La densidad de palabras clave no es la misma para todos los temas y negocios a tratar.

 No existe una densidad de palabras clave perfecta para todos los temas y, como tal, la f√≥rmula TF*IDF nos permite saber qu√© porcentaje de densidad de palabras clave puede ser la correcta para tratar un tema.   Todo ello, bas√°ndonos en una muestra grande de documentos, por ejemplo, de los 10 primeros resultados de Google. 

Eso nos permitir√° analizar la densidad de palabras clave de una muestra grande de documentos y la importancia de la misma para determinar si nosotros debemos aumentar o reducir la densidad de la palabra clave en nuestro sitio web/documentos.

Así, podemos saber la relevancia de un documento en concreto para una keyword.

Obtendr√°s un TF*IDF alto cuando la frecuencia de una palabra clave en una p√°gina sea mayor, pero si el n√ļmero de documentos que lo mencionan es bajo el n√ļmero ser√° menor.

Cómo usar el TF*IDF para optimizar un contenido para SEO

¬ŅQuieres crear los mejores textos para tu web o negocio y no sabes c√≥mo aplicar el TF*IDF correctamente?

¬ŅNecesitas actualizar una web antigua, donde el texto ha sido escrito por un “cavern√≠cola”?

La fórmula TF*IDF te puede ayudará para saber qué términos o palabras clave utilizar y la densidad de la misma.

A día de hoy, existen varias herramientas que lo hacen de forma automática, como son

SEOBILITY

Realmente, ésta es una de las herramientas más fáciles de usar para averiguar tu propio TF-IDF, dado que con tan sólo registrarte en la versión gratuita de prueba, podrás investigar hasta 10 keywords.

Seobility √ļnicamente te pedir√° la palabra clave y la URL desde donde quieres analizar esa keyword principal.

Por ejemplo, en mi caso he elegido “marketing de contenidos” y mi gu√≠a de “Marketing de Contenidos“, entrando desde la secci√≥n “Home > TF*IDF Tool“:

Aquí la tienes:

SEOBILITY para calcular el TF*IDF
What does the tf-idf metric from on page seo checker show

Esto te da la idea general de qué y cómo debes cambiar (o mantener) en tus contenidos, en función del resultado que vaya dándote la herramienta, así como de los factores TF y IDF de cada keyword utilizada.

Puedes usar su versión FREE algo limitada o bien COMPRARLA CON ESTE DESCUENTO en su misma web.

SEOLYZE

Otra de las herramientas más potentes del mercado actualmente para el cálculo y análisis de este término es SEOlyze, la cual, bajo el mismo ejemplo anterior, te devuelve una gran cantidad de datos.

√Čsta, adem√°s de mostrarte gr√°ficamente la frecuencia y relevancia de cada una de tus palabras m√°s recurrentes en el texto, tambi√©n te da sugerencias de mejoras, como ves en esta imagen:

SEOLYZE sugerencias para mejorar tus contenidos

Algo que me parece sencillamente genial, dado que si no estamos demasiado familiarizados a√ļn a usar la herramienta ni el concepto de TF*IDF, nos ser√° complicado descifrar lo que nos muestran sus gr√°ficos.

Pero además, lo que hace SEOlyze es que, en base a esas palabras más repetidas dentro de nuestro contenido, nos muestra cómo tratan esas keywords nuestros competidores. Concretamente el TOP10 actual de Google:

Te recomiendo que la pruebes, aunque sea durante sus 30 días de prueba gratuitos y analices tus contenidos más importantes, para así darle esos retoques que quizás podrían auparte a las posiciones de privilegio del buscador.

Conclusión

Ahora que ya sabes qu√© es el TF-IDF y el papel tan crucial que juega en la optimizaci√≥n de tus contenidos, ¬Ņa qu√© esperas? Ya puedes ponerte manos a la obra y analizar el contenido de tu web respecto a tus competidores.

De esta forma, lograr√°s optimizarlo en funci√≥n de c√≥mo te va a analizar posteriormente el crawler de Google y as√≠ darle se√Īales de que “mereces” esos primeros puestos.

Incluir tu palabra clave ‚Äútropecientas‚ÄĚ veces en tu web ya no sirve, debes hacerlo de forma natural, pero sobre todo, de manera M√ĀS PROFESIONAL.

A pesar de todo, debo puntualizar que el TF*IDF es un valor m√°s en tu estrategia de posicionamiento. Es importante, pero el √ļnico. Que la densidad de palabras clave no sea tu √ļnico factor o t√©cnica de posicionamiento web.

Saber este dato es importante, pero también es interesante saber la frecuencia correcta tanto en el propio documento como en todo el sitio web que queremos posicionar en los buscadores, como ya hemos visto.

Este cálculo y posterior análisis del algoritmo TF*IDF, junto a un completo KeyWord Research es el que yo utilizo en la gestión de blogs de mis clientes, dentro de mis servicios como Consultor de Marketing de Contenidos.

Podrán existir otros métodos, pero de momento a mí y a mis clientes nos va de maravilla y estamos consiguiendo posicionar multitud de keywords interesantes de nuestro negocio en tiempo récord.

Y t√ļ, ¬Ņconoc√≠as c√≥mo calcular el algoritmo TF*IDF?

¬ŅC√≥mo llevas a cabo t√ļ la optimizaci√≥n de los contenidos de tu Blog?¬†

[ratings]

¬ŅTe ha gustado este contenido?

Puntuación media 5 / 5. Recuento de votos: 1

Sé el primero en puntuar este contenido.

Publicaciones Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

2 comentarios

  1. Es un artículo muy completo Ismael. Actualmente escribía vigilando la densidad de la palabra clave en mis artículos y miraba la semántica de los mejores posicionados por la mismo. TF*IDF me ha abierto un nuevo mundo para analizar como lo usan los competidores.
    Me ha gustado mucho la herramienta SEOLYZE, la probaré.
    Enhorabuena por el artículo.

    1. ¬°Hola Javi! Me alegra que esta gu√≠a te haya ayudado. Lo cierto es que, como bien comentas, la densidad es √ļnicamente la punta del iceberg en este apasionante √°rea del Marketing de Contenidos. Hay muchos m√°s factores que el buscador tiene en consideraci√≥n a la hora de posicionar y dar relevancia a tus contenidos, como es √©sta del TF*IDF. Pr√≥ximamente ir√© sacando nuestros contenidos de los que estoy investigando y que te podr√°n ayudar a mejorar a√ļn m√°s tu Blog ūüôā Un abrazo amigo