ANALITICA TEXTUAL

ANALITICA TEXTUAL

INTRODUCCIÓN A LA CIENCIA Y APLICACIÓN DEL ANÁLISIS DE INFORMACIÓN NO ESTRUCTURA

ATKINSON ABUTRIDY, J.

24,80 €
IVA incluido
Disponible en 1 semana
Editorial:
MARCOMBO
Año de edición:
2023
Materia
Novedades
ISBN:
978-84-267-3613-0
Edición:
1
24,80 €
IVA incluido
Disponible en 1 semana

1 ANALÍTICA TEXTUAL ......................................................................................... 25
1.1 INTRODUCCIÓN .................................................................................... 25
1.2 MINERÍA DE TEXTOS Y ANALÍTICA TEXTUAL ......................................... 28
1.3 TAREAS Y APLICACIONES ...................................................................... 30
1.4 EL PROCESO DE LA ANALÍTICA TEXTUAL ............................................... 33
1.5 RESUMEN .............................................................................................. 36
1.6 PREGUNTAS .......................................................................................... 37
2 PROCESAMIENTO DEL LENGUAJE NATURAL .................................................... 39
2.1 INTRODUCCIÓN .................................................................................... 39
2.2 PROCESAMIENTO DEL LENGUAJE NATURAL ......................................... 41
2.3 NIVELES Y TAREAS EN NLP .................................................................... 42
2.3.1 Fonología .............................................................................................. 43
2.3.2 Morfología ............................................................................................ 44
2.3.3 Léxico .................................................................................................... 45
2.3.4 Sintaxis .................................................................................................. 51
2.3.5 Semántica ............................................................................................. 55
2.3.6 Razonamiento y pragmática ................................................................. 60
2.4 RESUMEN .............................................................................................. 60
2.5 EJERCICIOS ............................................................................................ 62
2.5.1 Análisis morfológico ............................................................................. 62
2.5.2 Análisis léxico ........................................................................................ 66
2.5.3 Análisis sintáctico ................................................................................. 68
3 EXTRACCIÓN DE INFORMACIÓN ....................................................................... 71
3.1 INTRODUCCIÓN .................................................................................... 71
3.2 EXTRACCIÓN DE INFORMACIÓN BASADA EN REGLAS .......................... 75
3.3 EXTRACCIÓN DE ENTIDADES NOMBRADAS .......................................... 76
3.3.1 Modelos de N-gramas .......................................................................... 78
3.4 EXTRACCIÓN DE RELACIONES ............................................................... 81
3.5 EVALUACIÓN ......................................................................................... 86
3.6 RESUMEN .............................................................................................. 88
3.7 EJERCICIOS ............................................................................................ 90
3.7.1 Extracción vía expresiones regulares ................................................... 90
3.7.2 Reconocimiento de entidades nombradas (NER) ................................. 94
4 REPRESENTACIÓN DE DOCUMENTOS .............................................................. 97
4.1 INTRODUCCIÓN .................................................................................... 97
4.2 INDEXACIÓN DE DOCUMENTOS ........................................................... 99
4.3 MODELOS DE ESPACIO VECTORIAL .................................................... 101
4.3.1 Modelo de representación booleana ................................................. 102
4.3.2 Modelo de frecuencia de términos .................................................... 103
4.3.3 Modelo de frecuencia inversa de documentos .................................. 104
4.4 RESUMEN ........................................................................................... 106
4.5 EJERCICIOS .......................................................................................... 107
4.5.1 Modelo de representación TFxIDF ..................................................... 107
5 ANÁLISIS DE REGLAS DE ASOCIACIÓN ............................................................ 115
5.1 INTRODUCCIÓN .................................................................................. 115
5.2 PATRONES DE ASOCIACIÓN ................................................................ 116
5.3 EVALUACIÓN ...................................................................................... 118
5.3.1 Support ............................................................................................... 118
5.3.2 Confidence ......................................................................................... 119
5.3.3 Lift ....................................................................................................... 119
5.4 GENERACIÓN DE REGLAS DE ASOCIACIÓN ......................................... 120
5.5 RESUMEN ........................................................................................... 124
5.6 EJERCICIOS .......................................................................................... 126
5.6.1 Extracción de reglas de asociación ..................................................... 126
6 ANÁLISIS SEMÁNTICO BASADO EN CORPUS .................................................. 131
6.1 INTRODUCCIÓN .................................................................................. 131
6.2 ANÁLISIS BASADO EN CORPUS ........................................................... 133
6.3 ANÁLISIS SEMÁNTICO LATENTE ......................................................... 135
6.3.1 Generación de vectores con LSA ........................................................ 136
6.4 WORD2VEC ......................................................................................... 140
6.4.1 Aprendizaje de embeddings en CBOW ............................................... 143
6.4.2 Predicción e interpretación de embeddings ...................................... 146
6.5 RESUMEN ........................................................................................... 148
6.6 EJERCICIOS .......................................................................................... 149
6.6.1 Análisis semántico latente (LSA) ......................................................... 149
6.6.2 Modelo de Word embedding del tipo Word2Vec .............................. 156
7 AGRUPACIÓN DE DOCUMENTOS ................................................................... 161
7.1 INTRODUCCIÓN .................................................................................. 161
7.2 CLUSTERING DE DOCUMENTOS .......................................................... 163
7.3 CLUSTERING K-MEANS ........................................................................ 169
7.4 MAPAS AUTOORGANIZATIVOS ........................................................... 172
7.4.1 Aprendizaje de mapas topológicos ..................................................... 174
7.5 RESUMEN ............................................................................................ 178
7.6 EJERCICIOS .......................................................................................... 179
7.6.1 Clustering via K-means ....................................................................... 179
7.6.2 Clustering vía mapas autoorganizativos ............................................. 185
8 MODELAMIENTO DE TÓPICOS ........................................................................ 188
8.1 INTRODUCCIÓN .................................................................................. 189
8.2 MODELAMIENTO DE TÓPICOS ............................................................ 191
8.3 LATENT DIRICHLET ALLOCATION ........................................................ 193
8.4 EVALUACIÓN ....................................................................................... 200
8.5 RESUMEN ............................................................................................ 202
8.6 EJERCICIOS .......................................................................................... 203
8.6.1 Modelamiento de tópicos con LDA .................................................... 203
9 CATEGORIZACIÓN DE DOCUMENTOS ............................................................. 209
9.1 INTRODUCCIÓN .................................................................................. 209
9.2 MODELOS DE CATEGORIZACIÓN ........................................................ 211
9.3 CLASIFICACIÓN BAYESIANA ................................................................ 214
9.4 CATEGORIZACIÓN POR MÁXIMA ENTROPÍA ...................................... 218
9.5 EVALUACIÓN ....................................................................................... 223
9.6 RESUMEN ............................................................................................ 225
9.7 EJERCICIOS .......................................................................................... 227
9.7.1 Categorización con Naïve Bayes ......................................................... 227
9.7.2 Categorización con Máxima Entropía ................................................. 232
10 CONCLUSIONES ................................................................................................. 239
Bibliografía ............................................................................................................. 244
Glosario .................................................................................................................. 250
Índice onomástico .................................................................................................. 253

Si desea obtener o entender sus propios datos textuales para descubrir y detectar automáticamente conocimiento valioso para su empresa, ha llegado al libro indicado. En él se proporciona una introducción a la ciencia y a las aplicaciones de la analítica textual o minería de textos (text mining) que le permitirá examinar fuentes de información no estructurada textual electrónica. La ciencia de la minería de textos es capaz de identificar información relevante y descubrir patrones ocultos desde grandes conjuntos de datos de naturaleza textual. Estos descubrimientos pueden convertirse en una forma estructurada que analizar e integrar en otro tipo de sistemas tradicionales de apoyo en la toma de decisiones (por ejemplo, en la inteligencia de negocios, en las bases de datos relacionales y en el data warehouses). Las aplicaciones de la minería de textos o analítica textual son prácticamente transversales en los ámbitos industriales, comerciales, científicos y públicos, por lo que este libro se convertirá en una herramienta clave para la toma de decisiones. Analítica textual se compone de 10 capítulos que combinan aspectos básicos teóricos de diferentes modelos y métodos computacionales, con ejercicios prácticos paso a paso a través del lenguaje de programación Python.

Artículos relacionados

  • SECUELAS DE UNA LARGUÍSIMA NOTA DE RECHAZO (CARTONÉ)
    BUKOWSKI, CHARLES
    «Secuelas de una larguísima nota de rechazo» es el primer relato que, con veinticuatro años, escribió Charles Bukowski y fue publicado en Story Magazine. «Si vas a intentarlo, que sea a fondo. Si no, mejor que ni empieces. Puede que pierdas familia, mujer, amistad, trabajos y hasta la cabeza. Puede que no comas en días, puede que te congeles en un banco de la calle. No importa...
    Queda 1 en Stock

    16,50 €

  • GRINDRBURGO (Y OTROS BARRIOS)
    MARTIN, GABRIEL J.
    Un manual gay para sobrevivir en redes La hoja de ruta psicoemocional definitiva para que los hombres homosexuales sepan manejarse de manera sana en apps de contactos y otras redes sociales. Ningún gay debería entrar en Grindr (ni prácticamente en Internet) sin leer este libro didáctico, vitamínico, reconfortante y, por supuesto, muy divertido.La psicología afirmativa del autor...
    Queda 1 en Stock

    22,90 €

  • LA SEDUCCIÓN
    TORRES, SARA
    Tras el éxito de Lo que hay, vuelve con una novela sobre la distancia, el deseo y la fantasía la autora «llamada a revolucionarlo todo» (Elle), revelación del año 2022 según los libreros independientes y uno de los mejores debuts del mismo año según El Cultural. «Todo lo que toca, lo que escribe, lo que observa, se convierte en belleza».Inés Martín Rodrigo, AbrilUna joven fotóg...
    Queda 1 en Stock

    18,90 €

  • FITOPOLIS. LA CIUDAD VIVA
    MANCUSO, STEFANO
    En pocas décadas, la humanidad ha experimentado una revolución en sus hábitos ancestrales. Sin que nos demos cuenta, nuestra especie ha pasado de habitar cada rincón de la Tierra, inmersa en la naturaleza, a vivir en una parte verdaderamente ínfima de las tierras emergidas del planeta: la ciudad. Una revolución sólo comparable a la transición de cazadores-recolectores a agricul...
    Queda 1 en Stock

    18,00 €

  • NO HAGAS MONTAÑAS DE GRANOS DE ARENA (Y TODO SON GRANOS DE ARENA)
    SANTANDREU, RAFAEL
    Por el autor del best seller El arte de no amargarse la vida. La terapia que ha transformado a millones de personas. Una nueva mentalidad que hará que te sientas cada día más contento, que no te enfades por pequeñeces y que goces de una gran autoestima. Este libro incluye capítulos especiales para:- Combatir el sobrepeso con facilidad.- Conquistar el éxito en lo que te proponga...
    Queda 1 en Stock

    20,90 €

  • SAKURA. DICCIONARIO DE CULTURA JAPONESA (NE)
    RUBIO, C. / UEDA, H.
    Sushi, haiku, geishaà la cultura japonesa despierta cada vez más interés y cada vez es mayor el número de términos y expresiones niponas que llegan hasta nosotros desde los más diversos ámbitos culturales. Algunos de estos términos ya los consideramos como propios; otros, sin embargo, nos resultan una incógnita, un misterio.Las palabras y expresiones recogidas en el diccionario...
    Queda 1 en Stock

    29,00 €