Temas de Investigación para Alumnos de Postgrado

Gonzalo Navarro
15 May 202018:58

Summary

TLDREn esta conferencia, el Dr. Contarino Navarro explora el campo de las estructuras de datos compactas, enfocándose en su importancia en el contexto de la evolución de la tecnología y las limitaciones físicas actuales. Expone cómo estas estructuras, diseñadas para ocupar poco espacio y permitir el manejo eficiente de datos, son fundamentales en dispositivos con memoria limitada y en aplicaciones de bioinformática. Además, comparte su experiencia en investigación y enseñanza, destacando la relevancia de su trabajo en la mejora del rendimiento y la reducción de costos en sistemas de información.

Takeaways

  • 😀 El área de investigación del orador está enfocada en estructuras de datos compactas, es decir, diseño de estructuras que ocupan poco espacio en memoria.
  • 📈 La evolución de la capacidad de almacenamiento y procesamiento ha llegado a un punto donde la memoria se vuelve más lenta en comparación con la CPU y la GPU.
  • 💾 Aparece la necesidad de varios niveles de memoria, donde cada nivel más cercano a la CPU es más rápido y costoso, y se busca optimizar el uso de esta jerarquía de memoria.
  • 🌐 La diferencia en tiempo de acceso entre memoria y disco se compara con la diferencia entre tomar un objeto del escritorio versus tomar un avión para ir a buscarlo.
  • 🌐 Las estructuras de datos compactas surgen para aprovechar la jerarquía de memoria y mejorar el rendimiento, permitiendo manipular datos sin descomprimirlos.
  • 🧬 El genoma humano es un ejemplo de datos altamente repetitivos que requiere técnicas especiales para su almacenamiento y búsqueda eficiente.
  • 🌐 La investigación en estructuras de datos compactas se relaciona con la teoría de la información y se centra en el diseño, análisis teórico y experimentación de estas estructuras.
  • 🔍 Se abordan técnicas para representar objetos como árboles, grafos y textos de manera compacta, permitiendo operaciones de consulta y navegación en tiempo constante.
  • 📚 Existe un libro que recopila varias estructuras de datos que se pueden representar en forma compacta, incluyendo secuencias de bits, permutaciones y secuencias de símbolos.
  • 🎓 Los alumnos del orador trabajan en temas relacionados con estructuras de datos compactas, bioinformática y bases de datos, y han publicado artículos en conferencias importantes.

Q & A

  • ¿Cuál es el área de investigación principal del orador?

    -El área de investigación principal del orador se relaciona con estructuras de datos compactas.

  • ¿Qué es la Ley de Moore y cómo está relacionada con el discurso?

    -La Ley de Moore es un principio que establece que el número de transistores en un circuito integrado se duplica aproximadamente cada 24 meses, lo que implica un aumento en la capacidad de procesamiento. Esto ha llevado a la creciente disparidad entre la velocidad de la CPU y la memoria, un tema central en la charla.

  • ¿Qué son las estructuras de datos compactas y por qué son importantes?

    -Las estructuras de datos compactas son diseños que permiten almacenar información de manera más eficiente en términos de espacio, lo que es crucial en contextos donde la memoria es limitada y costosa, y mejora el rendimiento al permitir que más datos se manejen en memoria rápida.

  • ¿Cómo se relacionan las estructuras de datos compactas con la jerarquía de memoria moderna?

    -Las estructuras de datos compactas se alinean con la jerarquía de memoria moderna al permitir que se utilice la memoria de manera más eficiente, lo que reduce el tiempo de acceso a los datos y se beneficia de los niveles superiores de memoria más rápidas.

  • ¿Qué es la diferencia entre compresión y estructuras de datos compactas?

    -La compresión implica almacenar datos de manera más eficiente pero requiere descomprimirlos para su uso, mientras que las estructuras de datos compactas mantienen los datos comprimidos pero permiten operar sobre ellos sin necesidad de descomprimirlos.

  • ¿Cuál es la aplicación práctica de las estructuras de datos compactas en dispositivos con memoria limitada?

    -En dispositivos con memoria limitada, como teléfonos móviles o sensores, las estructuras de datos compactas permiten almacenar más información y reducir costos de comunicación y energía, mejorando el rendimiento y la eficiencia.

  • ¿Cómo se pueden representar estructuras de datos complejas como árboles de sufijos de forma compacta?

    -Los árboles de sufijos pueden representarse de forma compacta utilizando técnicas que reducen la memoria necesaria, como la representación de los árboles en secuencias de bits, permitiendo operaciones complejas a pesar de la reducción de espacio.

  • ¿Qué es el árbol de sus hijos y cómo se relaciona con las estructuras de datos compactas?

    -El árbol de sus hijos es una estructura utilizada en bioinformática para representar secuencias genéticas. Su representación compacta es crucial para manejar grandes volúmenes de datos genéticos sin sobrepasar los límites de memoria.

  • ¿Cuáles son algunos de los desafíos en el diseño de estructuras de datos compactas para objetos complejos como árboles o grafos?

    -Los desafíos incluyen mantener la capacidad de realizar operaciones y consultas eficientes sin descomprimir los datos, así como adaptar la representación compacta a diferentes tipos de datos y estructuras.

  • ¿Cómo se evalúa el rendimiento de las estructuras de datos compactas?

    -El rendimiento se evalúa a través de análisis teóricos y experimentales, comparando el espacio ocupado y el tiempo de ejecución de las operaciones con soluciones clásicas.

Outlines

00:00

💻 Estructuras de datos compactas y la evolución tecnológica

El párrafo introduce el área de investigación de estructuras de datos compactas y su relevancia en la evolución de la tecnología, especialmente en relación con la Ley de Moore. Explica cómo, aunque los procesadores y la capacidad de memoria han crecido exponencialmente, otros factores como el tiempo de acceso a discos y redes no han seguido el mismo ritmo. Esto crea una jerarquía en la memoria donde, a medida que los datos se acercan físicamente a la CPU, son más rápidos pero también más caros. La investigación se enfoca en optimizar esta jerarquía con estructuras de datos que ocupen menos espacio sin perder eficiencia en el acceso y manipulación.

05:01

📚 Beneficios de las estructuras de datos comprimidas

Este párrafo se enfoca en las ventajas de las estructuras de datos comprimidas en un contexto donde la memoria es cada vez más barata, pero limitada en algunos dispositivos como celulares o sensores. Estas estructuras permiten almacenar y manejar grandes cantidades de datos en menos espacio, mejorando el rendimiento y reduciendo costos. También se mencionan casos como el almacenamiento del genoma humano, donde la compresión eficiente es esencial para búsquedas complejas y minería de datos. En lugar de comprimir y descomprimir datos, las estructuras compactas permiten manipular la información en su forma comprimida.

10:01

🌲 Representación y navegación en árboles compactos

El párrafo aborda cómo los árboles compactos se pueden representar y manipular utilizando secuencias de paréntesis, permitiendo realizar operaciones de navegación sin descomprimir los datos. Explica un método en el cual los nodos de un árbol se representan mediante paréntesis que se abren y cierran al recorrer los nodos. Este enfoque reduce el espacio necesario para almacenar el árbol, pero requiere técnicas avanzadas para poder realizar operaciones como encontrar el nodo padre o los hijos en tiempo constante. Se destacan las complejidades de mantener esta estructura comprimida sin comprometer la funcionalidad.

15:02

🧠 Técnicas avanzadas en estructuras de datos compactas

Este párrafo describe el uso del 'running backs train' para optimizar las operaciones de consulta en secuencias de paréntesis en árboles compactos. Al combinar búsquedas secuenciales con subidas y bajadas por el árbol, se logran acelerar las operaciones en tiempo constante. Se menciona que el campo de estructuras de datos compactas está bien desarrollado, y existen libros que recogen estas técnicas aplicadas a distintos objetos como árboles, grafos y textos. El autor finaliza mencionando sus temas actuales de investigación, incluyendo el trabajo con datos repetitivos y textos comprimidos, y destaca los logros de sus alumnos.

Mindmap

Keywords

💡Estructuras de datos compactos

Es el núcleo de la investigación del hablante y se refiere a formas de almacenar y manipular datos de manera más eficiente en términos de espacio. En el vídeo, se menciona que estos tipos de estructuras son esenciales para aprovechar la jerarquía de memoria en sistemas modernos, permitiendo que los datos se manejen rápidamente sin necesidad de descomprimirlos, lo que es crucial en dispositivos con memoria limitada.

💡Ley de Moore

La Ley de Moore es históricamente relevante en el ámbito de la informática y se menciona en el vídeo para ilustrar la rápida evolución de la capacidad de procesamiento y almacenamiento. Aunque en el discurso se señala que los límites físicos han hecho que esta ley no se aplique de la misma manera en la actualidad, sigue siendo fundamental para entender la historia y los retos actuales de la tecnología de la información.

💡Memoria

El concepto de memoria abarca diferentes niveles y velocidades, desde la memoria principal hasta la memoria caché y el almacenamiento en disco. En el vídeo, se discute cómo la memoria se ha vuelto más lenta en comparación con la CPU y la GPU, lo que ha llevado a la aparición de múltiples niveles de memoria para optimizar el rendimiento.

💡Jerarquía de memoria

La jerarquía de memoria es un concepto clave en la arquitectura de computadoras que se utiliza para optimizar el rendimiento y el costo. En el vídeo, se explica cómo las estructuras de datos compactas pueden aprovechar esta jerarquía para mejorar el rendimiento, permitiendo que los datos se accedan más rápidamente desde niveles de memoria más rápidos.

💡Compresión de datos

La compresión de datos es el proceso de reducir el tamaño de los datos sin perder información. A diferencia de la compresión clásica, que requiere descomprimir los datos para usarlos, las estructuras de datos compactas permiten operar directamente sobre los datos comprimidos, como se describe en el vídeo.

💡Árboles de sufijos

Los árboles de sufijos son una estructura de datos compacta utilizada en la bioinformática y la informática teórica para indexar textos de manera eficiente. En el vídeo, se menciona cómo estos árboles pueden representarse de manera compacta, permitiendo búsquedas y análisis rápidos sobre secuencias genéticas, lo que es crucial en el análisis de genomas.

💡Entropía

La entropía en teoría de la información mide la cantidad mínima de bits necesarios para representar un conjunto de símbolos. En el contexto del vídeo, se utiliza para definir el límite teórico del espacio requerido para representar estructuras de datos compactas, lo que es fundamental para diseñar sistemas que optimizan el uso de memoria.

💡Bioinformática

Bioinformática es el campo interdisciplinario que aplica métodos informáticos a los datos biológicos. En el vídeo, se menciona cómo las estructuras de datos compactas son esenciales en bioinformática, especialmente en el análisis de genomas, donde se manejan grandes volúmenes de datos genéticos.

💡Internet de las Cosas (IoT)

La IoT se refiere a la conexión de dispositivos electrónicos a internet, lo que permite la recopilación y análisis de datos. En el vídeo, se discute cómo las estructuras de datos compactas son importantes para dispositivos IoT, ya que permiten manejar grandes volúmenes de datos con menos recursos de hardware y comunicación.

💡Colecciones de textos

Las colecciones de textos son una aplicación de las estructuras de datos compactas, donde se almacenan y manipulan grandes cantidades de texto de manera eficiente. En el vídeo, se menciona cómo estos tipos de estructuras son útiles para la recuperación de documentos y el análisis de textos, permitiendo operaciones como búsquedas y modificaciones rápidas.

Highlights

El área de investigación de Contarello Navarro se centra en estructuras de datos compactos.

Las estructuras compactas surgen como solución a la creciente lentitud de la memoria en comparación con la CPU y la GPU.

La ley de Moore de 1965 predijo una duplicación cada dos años en la potencia de los sistemas de computación.

Hoy en día, se encuentran límites físicos que ralentizan la velocidad de la CPU y la expansión de la memoria.

La jerarquía de memorias ha crecido con la aparición de varios niveles, cada uno más cercano y rápido a la CPU.

Las estructuras de datos compactas permiten aprovechar la jerarquía de memoria para mejorar el rendimiento.

Las estructuras de datos compactas son ambiciosas, permitiendo el uso de datos comprimidos sin necesidad de descomprimir.

La importancia de las estructuras de datos compactas en dispositivos con memoria limitada, como teléfonos móviles y sensores.

Las estructuras de datos compactas pueden manejar conjuntos de datos más grandes con menos memoria.

El genoma humano como ejemplo de datos altamente repetitivos que requieren técnicas de estructuras de datos compactas.

Los árboles de sufijos como ejemplo de estructuras de datos que pueden representarse de forma compacta.

La teoría de la información es crucial para diseñar estructuras de datos que se acerquen al espacio de entropía.

La implementación y experimentación son aspectos fundamentales en la investigación de estructuras de datos compactas.

La representación de árboles usando secuencias de paréntesis y cómo operar sobre ellas sin descomprimir.

Los árboles de running Fisher, una técnica para acelerar operaciones en secuencias de paréntesis.

Las estructuras de datos compactas aplicadas a textos, árboles, grafos y otros objetos.

Los principales temas de investigación incluyen árboles, grafos, textos y datos altamente repetitivos.

La importancia de las estructuras de datos compactas en la bioinformática y la recuperación de documentos XML.

Los alumnos de Navarro han publicado en conferencias y trabajan en la academia e industria.

Navarro tiene financiamiento disponible para proyectos en bioinformática, bases de datos y estructuras de datos.

Transcripts

play00:00

bueno en esta charla contarles

play00:04

brevemente de qué se trata mi área de

play00:07

investigación y en qué temas se pueden

play00:09

hacer

play00:10

magíster o doctorado

play00:13

mi nombre es contarlo navarro mi área

play00:15

principal tiene que ver con estructuras

play00:17

de datos compactos

play00:19

tiene una presentación

play00:26

necesitamos

play00:29

una lista

play00:32

estructuras compactas

play00:36

y de qué se trata esto cuando surgen y

play00:40

esto me viene de algo que esté hecho muy

play00:43

importante recientemente pero tiene una

play00:45

muy larga data del choro lo puede llevar

play00:48

hasta el de la de la época de la ley de

play00:50

moore 1965 que notó que el número de

play00:55

transistores que conseguía el menor

play00:57

costo por transistor en un circuito

play00:59

integrado se duplicaba cada 24 meses y

play01:02

eso esencialmente quería decir que cada

play01:04

dos años el poder de los sistemas de

play01:06

conjunto se duplicaban

play01:09

y eso es lo que hay

play01:11

se veía por ejemplo en la cantidad de

play01:14

memoria se sigue viendo que va creciendo

play01:17

a este ritmo las cpu se hacían más

play01:21

potentes que la normal que se duplicaba

play01:23

la velocidad de la cpu que hablar cada

play01:25

dos años hoy en día ya se llega a

play01:27

ciertos límites físicos y lo que va

play01:29

creciendo la cantidad de procesadores el

play01:32

tamaño del disco pero como todo no todo

play01:37

se duplicaba cada dos años entonces lo

play01:39

explicado sanz lo por ejemplo el tiempo

play01:42

de respuesta de los discos los discos

play01:46

rígidos

play01:48

está estabilizado en unos milisegundos

play01:50

desde hace décadas porque usa y depende

play01:55

de otro tipo de mecanismos llamadas más

play01:58

mecánicos electrónicos y otra cosa que

play02:01

no se ha ido duplicando la velocidad de

play02:03

acceso a la red

play02:06

y eso hace que hoy en día

play02:10

en general se puede tener tanta memoria

play02:11

como se quiera pero esta memoria es cada

play02:15

vez más lenta con respecto a la cpu y la

play02:17

gpu se basa en la más rápida la memoria

play02:20

no se va a aumentar su tamaño y lo que

play02:23

siga pasando que van apareciendo

play02:24

distintos niveles de memorias que a

play02:27

zonas de cadera solamente el disco la

play02:29

memoria principal y el procesador tal

play02:33

vez un caché pero ahora aparecen varios

play02:36

niveles de calle y cada nivel y estamos

play02:40

más alto más cerca de la cpu es más

play02:43

rápida está más cerca físicamente es más

play02:46

cara porque es una tecnología mejor y

play02:49

más pequeña entonces hoy en día

play02:54

y tenemos varios niveles de casi todos

play02:58

han oído hablar de él luego mis dedos

play02:59

por lo menos y se fijan partimos de unos

play03:01

pocos registran las cpu con tiempos de

play03:03

acceso eran unos segundos

play03:06

pasamos por varios niveles de caché que

play03:08

son de decenas de menos segundos ya la

play03:12

que van creciendo en tamaño y se fijan

play03:14

cada amigas ya la rmi de típicamente

play03:16

unos pocos gigas de un tiempo de acceso

play03:18

de unos 60 - segundos de pasamos al

play03:21

disco que tiene unos pocos tiras pero

play03:23

que si se fijan tiene

play03:27

varios órdenes de magnitud más de tiempo

play03:30

de exceso que la memoria de hecho estar

play03:33

uno tan grande esta diferencia tiempo de

play03:37

acceso entre la memoria el disco y

play03:39

sentir una metáfora para entenderlo bien

play03:41

y hay una que dice que la diferencia del

play03:44

tiempo entre tener un dato en round

play03:46

versus traerlo en disco es comparable la

play03:49

de tomar el sacapuntas del escritorio

play03:54

comparado con el de tomarse un avión es

play03:57

china para ir a buscar el sacapuntas y

play03:59

regresar

play04:02

más

play04:06

las estructuras de las compactas surgen

play04:09

en este ámbito en el cual

play04:13

yo quiero aprovechar esa esta jerarquía

play04:17

de cpu en un contexto en que los datos

play04:20

que sean muy rápidamente

play04:22

son esencialmente estructuras de datos

play04:23

diseñados para ocupar poco espacio eso

play04:26

no es sólo compresión compresión es

play04:29

comprimir los datos si los cumplimos del

play04:32

guardado forma comprimida y si lo quiere

play04:34

utilizar los tengo que descomprimir

play04:37

primero la estructura de datos comparta

play04:39

son más ambiciosas lo que quieren es

play04:40

tener los tipos de datos comprimidos es

play04:43

decir los tipos de post tracto

play04:46

comprimido a decir yo los quiero tener

play04:49

comprimidos piden nunca descomprimiendo

play04:52

sino usarlos siempre en forma comprimida

play04:54

sin descomprimir la nunca acceder a

play04:57

cualquier dato almacenado directamente

play05:00

hacer consultas sobre los datos

play05:03

comprimidos y navegar sobre los datos

play05:06

buscar incluso modificarlos todo sin

play05:09

descomprimirlo nunca

play05:11

porque interesante un contexto en que la

play05:13

memoria es tan barata

play05:15

por venir cosas que mejoran el

play05:17

rendimiento debido a la jerarquía del

play05:19

memoria así como regidor que es las

play05:22

memorias de hacer más chicas y más

play05:24

rápidas

play05:25

también hay que mercer con la cpu si yo

play05:28

logro usar menos espacio en una

play05:30

estructura de datos tengo chance de

play05:31

meter en una memoria más ram con eso

play05:34

mejor el rendimiento el gran salto se da

play05:36

cuando logramos tener en memoria una

play05:38

estructura cristina tendría que ocupar

play05:40

el disco que un millón de veces más

play05:41

lenta

play05:43

y permite manejar las aceras más grandes

play05:46

con el dispositivo tiene memoria

play05:47

limitada de meneses celulares sensores

play05:50

radio que estos aparatos pequeños

play05:52

típicos del internet defensa son

play05:55

aparatos chicos y cuanto mejor cuanto

play05:57

más comparten las representaciones de lo

play05:59

que guardan más datos van a poder

play06:00

manejar

play06:01

y reducen costos de comunicación y

play06:04

energía imagínense que da tarjetas que

play06:06

tienen todos los datos de la memoria

play06:08

principal de cientos o miles de máquinas

play06:10

si si yo consigo utilizar menos memoria

play06:13

necesitan bien la máquina con menos

play06:15

hardware menos luz menos costo de

play06:18

comunicación etc

play06:21

como motivante pero que se puede lograr

play06:25

la estructura de otras compactas es el

play06:27

genoma humano el genoma humano tiene 23

play06:29

mil millones de bases así que como cada

play06:33

base se representa con cuatro letras

play06:35

posibles necesitamos sólo dos bits por

play06:37

cada base y eso significa que podríamos

play06:39

compartir fácilmente en una memoria ram

play06:41

de un hit sobre de un poco de espacio

play06:44

pero los biólogos no necesitan tener

play06:47

genoma de marsden ave sino además que

play06:49

necesiten es hacer búsquedas complejas

play06:51

en el abdomen con tres repeticiones

play06:52

encontrar en secuencias determinadas que

play06:57

aparecen determinados lugares hacer

play06:59

minería para encontrar patrones

play07:00

frecuentes etc

play07:02

similitudes y estas operaciones son muy

play07:05

lentas en forma secuencial

play07:08

hay personas que toman tiempo

play07:10

cuadráticas y si no tengo un índice que

play07:14

se pueden hacer tiempo lineal

play07:15

construyendo un índice

play07:18

un índice que resuelve muchos de esos

play07:20

problemas relevantes a buscar complejas

play07:23

es el árbol de sus hijos

play07:25

pero para un genoma humano requiere

play07:27

entre 30 y 60 gigas de memoria y para la

play07:31

mayoría de los algoritmos sobre el borde

play07:32

sus hijos no tienen localidad referencia

play07:35

entonces no se llevan bien

play07:39

en la práctica el árbol de su hijo así

play07:41

como éstas sólo se producen en secuencia

play07:43

de juguete en cambio en estos últimos

play07:46

años ha habido

play07:47

desarrollan como representar árboles en

play07:49

sus fijos en forma compacta ya han

play07:53

logrado meterla en una rama de lógica

play07:56

donde las operaciones son más lentas que

play07:58

con un árbol de sufijos clásicos si es

play08:01

que las de la misma memory pero si yo

play08:03

tenga que meter el árbol de sus fijos

play08:05

que hace con un disco porque no me cabe

play08:07

en memoria que es lo más normal entonces

play08:10

tenerlo compacta memoria principal es

play08:12

infinitamente más rápida

play08:17

y que se trata la investigación entonces

play08:19

en general relacionamos conceptos de

play08:21

teoría de la información con conceptos

play08:24

de estructuras de datos esos son los dos

play08:26

grandes ejes que se cruzan aquí

play08:28

un cierto universo de objetos que

play08:30

queremos representar por ejemplo

play08:31

queremos representar árboles establece

play08:33

una noción de entropía esta otra piel la

play08:36

cantidad mínima de hábitat es está allí

play08:38

para representar urgiendo de ese

play08:40

universo y distinguirlos de los otros

play08:43

no sé lo que hacemos es intentar obtener

play08:45

estructuras de datos

play08:47

usando espacios cercanos a esta entropía

play08:50

permite representar y manipular esos

play08:53

objetos esencialmente lo que se hace

play08:57

entonces hay un aspecto que es de diseño

play08:59

de estructuras de datos compactas de

play09:00

toda clase grafos árboles textos

play09:04

documentos grilla geométrica en un

play09:07

montones de distintos objetos de estos

play09:12

hay un aspecto de análisis teórico de su

play09:15

desempeño en espacio y tiempo cuando

play09:17

ocupan cuál es la entropía de estos

play09:20

objetos y cuánto tiempo demora las

play09:23

operaciones cuánto tiempo demora las

play09:25

modificaciones etc

play09:28

y hay una componente importante sobre

play09:30

todo con alumnos de implementación y

play09:32

experimentación en la cual se compara el

play09:36

tiempo y el espacio que ocupan estas

play09:37

estructuras compactas comparadas con

play09:39

otras compradas por soluciones clásicas

play09:44

un ejemplo de árboles generales y

play09:47

hablábamos con un árbol general con una

play09:50

estructura clásica de puntero les ocupa

play09:52

en el vm bits para un árbol de en ese

play09:55

orden de reloj de naves porque necesitan

play09:58

n punteras o sea que no hay un puntero

play10:00

que les llega así que hay en punteros

play10:02

las punteras necesitan los bits para

play10:04

poder distinguir entre en objeto por lo

play10:06

menos así que tienen los orden del medio

play10:08

viene bits

play10:10

y eso permite navegar en el árbol en

play10:12

tiempo constante y de hoy mismo y al

play10:14

padre etc pero si no se fija y solamente

play10:17

controla inés sobre 9 a 3 medias hacia

play10:20

mente árboles distintos que tienen en

play10:23

ojos

play10:24

con lo cual si yo tomo el logaritmo de

play10:26

eso descubro que se podrían almacenar

play10:29

estos árboles usando básicamente 12 bits

play10:33

un orden de 32 bits por nodo esto debe

play10:36

ser suficiente para representar una

play10:38

topología y en realidad vamos a ver no

play10:41

es tan difícil representar un árbol en

play10:43

este espacio

play10:45

lo que sí es difícil es todos los

play10:47

navegar en ese espacio sin descomprimir

play10:49

hoy en día se conocen formas de realizar

play10:51

un gran número de operaciones de

play10:53

consulta y navegación en árboles en

play10:55

tiempo constante usando esta cantidad de

play10:58

pits vamos a darles una idea fíjense

play11:01

esta representación del tomo un árbol

play11:04

y lo recorro haciendo de fe estén

play11:06

abriendo un paréntesis cada vez que

play11:08

llego a un modo por primera vez y

play11:10

cerrando un paréntesis cuando lo

play11:12

abandona por última vez entonces tenemos

play11:15

el paréntesis que abre para el luego en

play11:17

el que abre para todos el quiebre para

play11:18

el 3 después cierran del 3

play11:20

volvemos arriba hacia el 2 bajamos al 4

play11:23

34 cierre los cuatro días lo que nos

play11:25

quede una secuencia con dos en

play11:27

paréntesis y esos son los vagina bits

play11:30

sin partes y solo presión hasta que con

play11:33

un bis por paréntesis en el alcance y si

play11:35

ustedes pueden fácilmente representar el

play11:38

árbol

play11:40

ahora como les decía lo que es más

play11:42

desafiante es poder hacer operaciones

play11:45

sobre esa secuencia de paréntesis y

play11:47

estimular la navegación en el árbol

play11:50

uno puede definir unas pocas operaciones

play11:52

básicas sobre estas secuencias iniciales

play11:55

llamado aquí

play11:59

como una persona franca que me cuenta

play12:02

cuántos para que se haya abierto

play12:03

sostienen cierta posición clubs de un

play12:06

paréntesis que abra me dice dónde está

play12:08

el que cierra o vende un paréntesis que

play12:10

cierra me dice dónde está el que hable y

play12:12

en close de un paréntesis que abra me

play12:14

diste dónde está el paréntesis más

play12:16

cercano que lo contiene

play12:19

porque fíjate que estás secuencia de

play12:21

paréntesis son tan malas se habla de

play12:23

vestirlo

play12:24

un par de sentimiento que lo cierra y si

play12:27

lo de más profundos sus partes están

play12:30

contenidas en esos estas operaciones

play12:33

paso de este puede reducir a primitivas

play12:36

un tema bajo nivel que lo que hacen es

play12:38

buscar exceso del exceso en de una

play12:41

posición es la cantidad paréntesis que

play12:43

habrá en menos la cristiana hasta esta

play12:45

posición

play12:47

y se puede expresar en términos de

play12:49

arranque

play12:51

i

play12:53

esta operación estas primitivas y estas

play12:56

se pueden resolver en tiempo constante

play12:58

usando sobre las dos n vistas para decir

play13:01

solamente orden chiquito de m bits extra

play13:03

y con eso simplemente un gran número de

play13:05

operaciones de navegación por ejemplo

play13:08

imagínense que identificamos cada nodo

play13:10

del árbol con el paréntesis que lo abre

play13:12

en 2022 en amarillo se identifica con el

play13:15

primer paréntesis que abre de la zona

play13:17

amarilla si ustedes le toman el close a

play13:21

este paréntesis llegan al final de la

play13:24

zona amarilla y si toman el largo de la

play13:26

zona amarilla / 2 lo que tienen es el

play13:29

tamaño del subaru

play13:32

el nodo 8 que corresponde a la zona

play13:35

naranja ustedes pueden saber que es una

play13:37

hoja porque justo después del paréntesis

play13:38

que abre hay uno que es tierra con eso

play13:41

está bien que es una hoja

play13:44

pueden recorrer los hijos del 2 por

play13:47

ejemplo en 3 el siguiente paréntesis que

play13:49

abre después del 2

play13:51

buscarán que los cierran y después de

play13:54

que los cierran que abre es el siguiente

play13:55

hermano el 4 después que cierra el 4 que

play13:58

es el siguiente hermano el que sigue es

play14:00

el 5 en el 5 este paréntesis que abre

play14:03

aquí que si buscan después de que la

play14:06

sierra y van a la siguiente posición

play14:08

encuentran el 9 se pueden visitar los

play14:10

hijos de un nodo tomando el paréntesis

play14:13

que me cierra viviendo que así también

play14:15

pueden darse cuenta que el exceso de una

play14:19

posición corresponde a la altura a la

play14:21

profundidad del nodo los paréntesis que

play14:23

en un recorrido de fs están abiertos

play14:25

hasta aquí pero todavía no cerrados si

play14:28

cuentan el rango la cantidad para ser

play14:30

abierto lo que tienen es la posición del

play14:32

nuevo entre orden

play14:35

pueden comprar los que cierran a cerrar

play14:37

de los que cierran en contra el post o

play14:39

orden del paréntesis es decir pueden

play14:42

hacer varias operaciones interesantes

play14:45

simplemente con con estas pocas

play14:47

permitidos

play14:48

puedes saber por ejemplo que el 8

play14:49

diciembre del 2 porque su paréntesis

play14:52

está entre el que abre el 2 y su club

play14:55

entonces está contenido si puedo

play14:57

rápidamente que 1 202 y así que son no

play15:00

es tan fácil una representación de

play15:02

paréntesis

play15:04

para resolver estas operaciones se usa

play15:06

un árbol que se llama el running backs

play15:08

train que me guarda varias de estos

play15:11

indicadores sobre el exceso del exceso

play15:13

total al mínimo o máximo exceso en zonas

play15:16

de la secuencia de paréntesis no sé

play15:18

esencialmente yo para calcular una

play15:20

operación hago una pequeña parte

play15:23

secuencial después subo al árbol hasta

play15:25

cierra hasta que encuentro el que

play15:27

contiene la respuesta y bajó por él y

play15:29

termina completando la operación en las

play15:31

paredes eso acelera todas las

play15:33

operaciones y bien parametrizado el

play15:36

constante

play15:39

si sigues en un ejemplo en muchas

play15:40

estructuras muy bonitas el área de

play15:42

estructuras de datos compactas está

play15:43

bastante desarrollado hoy en día existe

play15:46

el primer libro sobre ellas que toma

play15:49

toma la cumbre digamos varias

play15:51

estructuras de datos que se pueden

play15:54

representar en forma compacta como

play15:55

secuencia de bits permutaciones

play15:58

secuencia de símbolos para investir como

play16:00

vimos árboles grafos grillas geométricas

play16:04

texto etc

play16:07

mis principales temas de investigación

play16:08

en este momento son estructuras de datos

play16:10

básicas árboles grafos bueno todas estas

play16:14

estoy interesado en datos altamente

play16:16

repetitivos que están surgiendo mucho

play16:18

últimamente por los documentos con muy

play16:21

diversión y esta competición fuerte

play16:23

multi versiones por los secuenciadores

play16:26

de genomas que producen muchos genoma o

play16:29

reese de la misma especie que tiene

play16:31

mucha repetitividad y son muy

play16:33

comprensibles pero necesitan técnicas

play16:34

distintas las que existan trabajo muy

play16:37

especialmente en colecciones de textos

play16:39

se trace diccionarios recuperación de

play16:42

documentos xml

play16:44

árboles de sufijos como vimos y también

play16:47

al tema de en collins que son

play16:48

estructuras que ya no permiten recuperar

play16:51

los datos originales sino solamente

play16:53

responder cierto tipo de preguntas y

play16:55

entonces pueden romper las barreras de

play16:57

la entropía porque nos permite recuperar

play16:58

los datos

play16:59

aquí como tessio codificar a sólo el

play17:02

tipo de toks track

play17:03

puedo realizar las operaciones que me

play17:06

das tipos del dos tracto pero no puedo

play17:07

recuperar el dash

play17:11

e

play17:12

podemos consultar en esta página de las

play17:15

tesis realizadas para que vean el tipo

play17:17

de trabajo que han hecho mis alumnos en

play17:20

este momento tengo dos alumnos de

play17:22

magisterio 5 de doctorado no todos en

play17:25

chillán

play17:27

y ponerlos los temas que están

play17:30

relacionadas con los que vimos antes y

play17:33

está este cuadro para que vean que mis

play17:37

alumnos pasan bastante por unas paseaban

play17:39

bastante antes del

play17:41

de la época del corona vinos

play17:45

conference es donde han publicado esta

play17:47

villa es que han hecho y donde donde

play17:50

están laboralmente en general están de

play17:53

profesores de universidades en puestos

play17:55

interesante en la industria algunos

play17:57

haciendo doctorado y bajista

play18:03

desde 2008

play18:06

las estrellitas son este para word

play18:10

presenta los mejores artículos de

play18:13

estudiantes

play18:18

finalmente dispongo de ir bastante

play18:21

financiamiento en financiamiento para

play18:24

temas de bioinformática para temas de

play18:25

bases de datos y para tema de

play18:28

estructuras de datos compartan en

play18:30

general

play18:32

esto eso es todo los espera pueden

play18:34

escribir una tenían el mail del comienzo

play18:36

de la de las tres 'leyes si tienen algún

play18:39

tema de investigación que les interesa

play18:41

en particular rossi le pareció

play18:43

interesante el área y podemos buscar

play18:45

algún tema

play18:50

eso es todo

play18:54

me despido gracias por su atención

Rate This

5.0 / 5 (0 votes)

الوسوم ذات الصلة
Estructuras de DatosInvestigaciónBioinformáticaMemoria HíbridaCompactaciónAlgoritmosDesempeñoMoore's LawNavarroMagíster
هل تحتاج إلى تلخيص باللغة الإنجليزية؟