Los datos entre dos aguas: los humanos y las máquinas

Alvin Lezama 9 junio, 2022 - 6:01 a. m.
Humanos y máquinas

Datos para decidir, para conocer y comprender, para comunicarnos y para producir. A través de ellos nos relacionamos, nos reconocemos y descubrimos, nos adaptamos, creamos y transformamos. Los datos forman parte de nuestra vida cotidiana, como personas, como organizaciones, como empresas, como sociedad.

Entonces, qué novedades hay en relación a los datos que los hace particularmente importantes hoy. Posiblemente que son el combustible y el motor de los avances y las innovaciones en la ciencia y la tecnología que prometen cambios radicales a nivel mundial, en todos los ámbitos. Un cambio donde todas/todos y todo será representado y expresado en datos en su forma digital.

Es el empleo masivo de los bienes y servicios producidos por la Tecnología de Información en la creación de espacios digitales y virtuales para la vida, en la automatización y optimización de la producción, en la economía, en las finanzas, en la política, en la investigación y desarrollo de la ciencia y tecnología misma, hasta donde alcance la imaginación.

En este nuevo paradigma la máquina, potenciada por las Tecnologías especialmente por las Tecnologías de Información (TI), es la protagonista, el centro de la atención. Ahora dotada de inteligencia artificial y de cierta autonomía, promete liberar y potenciar a la humanidad de los trabajos ya no solo manuales sino intelectuales.

Carros, relojes y prendas de vestir, ciudades, hogares, fábricas, organizaciones, entre otras, serán inteligentes y estarán conectados en red entre sí. Juntas y juntos conformarán una especie de sistema nervioso global. Se trata de una red total, no solo de las personas sino también de las organizaciones y de las cosas.

Imaginemos el volumen y la frecuencia de los datos digitales que se generarán en esta red. Ello demandará de nuevas herramientas, métodos y metodologías para el manejo y procesamiento de estos datos digitales.

Esta situación contrasta con el estado del mundo actual, extremadamente desigual, agotado a nivel de recursos naturales, con un cambio climático casi irreversible que amenaza con la destrucción de la vida y la existencia del planeta, estamos al borde del colapso. Para abordar y resolver esta situación hacen falta datos para conocer con la mayor precisión posible los problemas, para decidir en las acciones que se deben tomar en los diferentes niveles de gobierno, para hacer el seguimiento y control, para resolver esta crisis sistémica. En estos esfuerzos, los datos también son fundamentales, no solo para construir el futuro y la transición hacia él, sino para salvar el presente.

Por eso en esta oportunidad reflexionaremos sobre los datos entre dos aguas: los humanos y las máquinas.

Unas preguntas para imaginar

Desde la persona

¿Cuántos datos tiene Ud. guardados y qué valor les da?. ¿Cuántos están en papel y cuántos en digital?.¿En cuántas cuentas tiene los datos digitales?. ¿Esos datos están distribuidos entre archivos de texto, de presentaciones, de dibujos y hojas de cálculo, en base de datos, en agendas de contacto, etcétera?. ¿En cuántos dispositivos los tiene?. ¿Los ha perdido alguna vez? Si los perdiera, ¿cómo se sentiría?. ¿Ud. tiene respaldo de esta información digital?. ¿Cuántos datos son personales y cuántos son para el trabajo? ¿Ud, sabía que los datos en sus cuentas de correo y redes sociales están guardados en centros de datos de las empresas que le prestan este servicio, como copias de seguridad?.

¿Ud. es fanático de algún deporte?. ¿Le hace seguimiento?. ¿Lleva un registro de los resultados?. ¿Ud. planifica su presupuesto?, ¿Le hace seguimiento a sus gastos?, ¿Ud. sabe algo de estadísticas y probabilidades?. ¿Ud. guarda su facturas, las revisas o simplemente las bota a la basura?. ¿Cuándo Ud. va a comprar un bien o contratar un servicio Ud. busca los datos pertinentes que le permitan orientar su elección?.

Desde el Gobierno

¿Cuántos datos tiene registrado y almacenados?. ¿Desde cuándo?. ¿Cuánto están en papel y cuántos están en digital?. ¿Cómo recolecta estos datos: en censos, con encuestas, con sondeos de opinión, con registros realizados por los entes que prestan servicio público?. ¿Tienen sistemas de información para uso interno y para uso público?¿Tienen sistema de información geográfico? ¿Tienen indicadores e índices por sector?¿Con que regularidad los calculan?¿Le son útiles para su gestión?. ¿Cuánto valor le asignan a los datos en su organización?

Desde el empresario

En la globalización la dinámica cambia, los mercados se crean, se desarrollan y desaparecen a un ritmo difícil de seguir. La competencia ya no es contra un empresa del sector sino contra la innovación y el tiempo. Se compite por los clientes, usuarios, consumidores. ¿Cómo estar pendiente del desempeño de la empresa en todos sus procesos internos y a la vez monitorear al mercado y al consumidor en “tiempo real”?

En General

¿Cómo saber si se están tomando las acciones apropiadas que contribuyen a resolver el problema o cambiar la situación que afecta a un país, a una población, a un paciente, individuo o colectivo que se ve afectado?.¿Cómo actuar en un mundo tan dinámico y cambiante? ¿No solo actuar a tiempo ante un suceso sino actuar para prevenirlo?.

¿Qué buscar cuando se quiere comprender o entender algo que pasa recurrentemente? ¿Qué hacer si se quiere mejorar la capacidad de respuesta ante los hechos que se repiten, incluso evitarlos si éstos tienen efectos perjudiciales o indeseables?.

¿Cómo garantizar que se va en el camino correcto, a pesar de los retrasos y los obstáculos e inconvenientes que se encuentran en esa ruta trazada en nuestro mapa?.

Si en sus respuestas están los datos o la información, que no es otra cosa que los datos agrupados y procesados, estamos en sintonía.

Hoy todo es más rápido, está interconectado, interrelacionado y es interdependiente.

¿Qué hay de la relación entre los datos y los humanos?. ¿Los datos y la realidad? ¿Los datos y las máquinas?. ¿Los datos y el conocimiento?

Veamos la cantidad de datos y su ritmo de producción en el mundo digital:

Primero, hagamos la siguiente convención: en lugar de hablar de unidades de memoria abstractas, nos referiremos a su equivalente en número de Computadores Personales (PC, por sus siglas en Inglés). Una PC típica tiene un disco de memoria de 1 Tera Byte, equivalentes a 1.000 Giga Bytes.

¿Cuánto datos se producen en el mundo digital?

  • Facebook crea diariamente, con sus 350 millones de fotos y 100 millones de hora de vídeo, el equivalente de datos que se consumen la memoria de 1.000 PCs. (VisualCapitalist 2019)
  • La data diaria generada por un vehículo conectado se consume la memoria de 4 PCs.(Ib.)
  • Todo los relojes inteligentes diariamente generan datos que se consumen en equivalente en memoria de 28.000 PCs. (Ib.)
  • En el 2015 se creó diariamente datos que consumieron el equivalente en memoria de 2,5 millones de PCs. (Adeptia 2015). Se estima que esta cifra crecerá en el 2025 a 463 millones de PCs. (VisuaCapitalist 2019)
  • En el 2013, el universo de datos digital total acumulado era el equivalente a la memoria de 4,4 millardos de PCs. En el 2020 esta cifra llegó al equivalente de 44 millardos de PCs. (Ib.). En el 2021, esta cifra llegó al equivalente en memoria de 79 millardos de PCs. (Data never sleep – 9, Domo 2021)
  • IDC estimó que la data digital total en el mundo para el 2025 sería el equivalente a la memoria de 175 millardos de PCs. (IDC y Segate, Noviembre 2018)

¿Cuántas fuentes generadoras de datos digitales se estima?

Hay 1.155.729.496 sitios web, cifras de mayo del 2022 (Netcraft).
10 millardos de dispositivos para Internet de las Cosas (IoT, por sus siglas en inglés) en el 2020. Y 12,2 millardos de dispositivos IoT en el 2021. Se estiman 14,4 millardos de dispositivos IoT para el 2022 y 27 millardos para el 2025 (IoT Analytics).

¿Con qué velocidad se generan estos datos?

Los servicios de redes sociales son los que más actividad presentan por minutos.

Fuentes generadoras de datos con su actividad por minuto, (sólo una muestra):

  • Usuarios de Facebook compartieron 240.000 fotos (Data never sleep 9.0, Domo-2021).
  • Usuario de Twitter colocaron 575.000 trinos (Ib.).
  • Usuario de Snapchat enviaron 2 millones de Snapchat (Ib.).
  • Zoom alojó 850 seminarios web (webminar)
  • Usuarios de YouTube subieron 500 horas de vídeo (Data never sleep-8.0- Domo2020).
  • Se enviaron 188.000.000 de emails (Ib.).

¿Cuántos datos en “tiempo real”?.

En el 2017 los datos en “tiempo real” representaron el 15% del total de datos. Se estima que crecerán a 30% del total, en el 2025. Los datos generados en “tiempo real” son aquellos que requieren una atención “inmediata”, pues tiene que ver con la supervisión o el control de procesos o de alguna variable de importancia en el caso de las personas. Son datos que no toleran retrasos en el tiempo de respuesta en su manejo, a partir de un umbral. Su mayor volumen se originará en las personas conectadas. IDC estima que habrán, para el 2025, en promedio 4.900 interacciones digitales diarias por persona. Esto es equivalente a una interacción digital cada 18 segundos (IDC-Segate, 2018).

¿Cuáles situaciones se presentan entre la relación de los datos con su uso por los humanos?

  • La falta de datos confiables, suficientes, de calidad y oportunos fueron parte de las conclusiones del documento “Objetivos de Desarrollo del Milenio”, Informe 2015, ONU.
  • No hay datos que visibilicen situaciones de exclusión y desigualdad importante como por ejemplo: refugiados, poblaciones de desplazados, migrantes solicitantes de asilo, situaciones de pobreza, hambre, servicios, salud, violencia, etcétera. (Ib.)
  • No hay continuidad, ni metodología y estandarización en la producción de los datos que permita armonizarlos, integrarlos y usarlos a nivel regional o mundial.
  • Hay desigualdad en las capacidades técnicas y en talento humano en el área de estadísticas y ciencia de datos que crea brechas entre países en relación a la producción, manejo y uso de los datos.
  • Algunas observaciones sobre la situación, al 15 de diciembre del 2017, de los 232 indicadores de las metas correspondientes a los 17 Objetivos de Desarrollo Sostenible de la Agenda 2030 (ODS-2030), según el “Segundo informe anual sobre el progreso y los desafíos regionales de la Agenda 2030 para el Desarrollo Sostenible en América Latina y el Caribe” (ONU-Cepal, Abril 2018):

93 indicadores se encuentran en el nivel I ( “el indicador es claro desde el punto de vista conceptual, se dispone de una metodología establecida internacionalmente y de normas, y los datos son producidos periódicamente por al menos el 50% de los países y de la población en todas las regiones en que el indicador es pertinente”).

66 indicadores se encuentran en el nivel II (“el indicador es claro desde el punto de vista conceptual y se dispone de una metodología establecida internacionalmente y de normas, pero los datos no son producidos periódicamente por los países”).

68 indicadores se encuentran en el nivel III (“aún no se dispone de metodología o normas establecidas internacionalmente para el indicador, pero éstas se están elaborando o poniendo a prueba, o se elaborarán o pondrán a prueba”) y 5 indicadores se encuentran en múltiples niveles.

También, en el informe se presenta la situación de la región de América Latina y el Caribe. En promedio en la región, en relación a estos indicadores: se producen el 27% de los indicadores. El 18 % no se producen pero se pueden producir con las fuentes de información existente. Del 22% de los indicadores se tiene alguna información para producir el indicador. Del 21% no se tiene información para producir el indicador. Del 12% de los indicadores no se tiene respuesta. Destacan: Cuba y Uruguay que producen el 51% de los indicadores. Si completan y mejoran la información, estos dos países pueden llegar a producir el 68% y 77% de los indicadores, respectivamente. 12 países de la región están por debajo del promedio de la región en producción de indicadores, y son: Honduras, Colombia, República Dominicana, Paraguay, Antigua y Barbuda, República Bolivariana de Venezuela, Guatemala, Haití, Estado Plurinacional de Bolivia, Granada, San Vicente y Granadinas, Barbados. (Ib.)

Desde estas dos perspectivas presentadas ¿Dónde se coloca el acento y el énfasis?. En los productos, servicios y empresas, en un caso. En las finalidades, los usos y los desafíos concretos de la humanidad, en el otro caso.

¿Qué hay de la valoración explícita de los datos en los dos enfoques?.

Los datos en las aguas de las máquinas crecen exponencialmente y sin control. Nada los filtra ni los detiene. Se enfatiza la cantidad pero nada se menciona de la calidad, de la finalidad y del valor.

En el otro enfoque, los datos en las aguas del dominio de los humanos, se valoran los datos por su pertinencia, calidad, finalidad y usos, suficiencia, oportunidad.

El dato es consustancial al hombre, si le entendemos como la “unidad mínima de conocimiento”. El hombre como creador y portador de cultura dispuso del signo para conocer y comunicarse. Para adaptar y trasformar. En él nace la representación y el significado de los datos. En él se da el sentido, la valoración y la interpretación de los datos.

Para el humano los datos representados, imaginados u obtenidos de la realidad (“hechos”), tienen múltiples significados, sentido, valoración e interpretación. Dependen de él, de su contexto, de su necesidad, deseo, interés y motivación.

Para las máquinas, los datos son representaciones con significado concreto, preciso, sin ambigüedad, consistentes en todo momento. Los datos son ordenes codificadas que se obedecen y se traducen en acciones. Desde un torno o fresadora, manual o automatizada, pasando por máquinas de control numérico, hasta computadoras, todas son máquinas que manejan datos bajo este enfoque. La Inteligencia Artificial busca emular, desde la Tecnología de Información, el complejo procesamiento de información humano en su dimensión cognitiva.

Los datos, su producción, su procesamiento y su resultado final estarán siempre supeditados al humano. Se debe elegir: Entre formas y métodos de recolección. Entre modelos estáticos o dinámicos, matemáticos o estadísticos. Entre métodos para el procesamiento de la información. Entre herramientas y aplicaciones de tecnologías de información (TI) que asisten en todas estas fases mencionadas. Todas estas elecciones son importantes pero secundarias y dependen de las respuestas que se den a preguntas fundamentales en la dimensión de lo humano, tales como: Datos ¿para qué?, ¿por qué? y ¿para quién?,.

Hay múltiples herramientas y métodos para producir, gestionar y procesar datos digitales.

Resultado de esta exploración, creemos que también es de utilidad responder a estas otras preguntas, antes de embarcarse con una estrategia de datos:

¿De qué sirve una meta sino tiene cómo medirse?.

¿De qué sirve una meta sino apunta al problema real que se pretende abordar?.

¿De qué sirve un modelo sino guarda correspondencia con el problema real que se pretender monitorear, evitar o resolver?.

¿Qué valor tiene un dato que nada nos dice sobre una situación, fenómeno o problema que se quiere conocer?. Los datos sólo dan respuesta a quiénes tienen preguntas.

En relación a la situación actual de los datos en las aguas de las máquinas, sólo queremos dejar para la reflexión esta advertencia realizada en el informe de la Conferencia de las Naciones Unidas sobre Comercio y Desarrollo (UNCTAD de septiembre del 2021):

“La promesa de la revolución de los datos no ha sido ninguna exageración, pero la inversión necesaria para desarrollar modelos robustos y validados tiende a escamotearse. A su vez, esto puede dar lugar a un «pico de expectativas desmedidas» y a un posterior «desplome del entusiasmo», como explican los investigadores de la compañía tecnológica Gartner7.” (UNCTAD, Septiembre 2021)

“A medida que avanza la carrera por el liderazgo en desarrollos tecnológicos para obtener ventajas económicas y estratégicas, las plataformas digitales globales continúan expandiendo sus propios ecosistemas de datos y controlan cada vez más todas las etapas de la cadena de valor global de los datos.

Por lo tanto, dice el informe, se vuelve cada vez más difícil considerar las regulaciones de los flujos de datos transfronterizos sin considerar también la gobernanza de las corporaciones digitales.” (Ib.).

“El informe advierte que está surgiendo una brecha a medida que evoluciona la economía digital impulsada por los datos, lo que hace que muchos países en desarrollo se conviertan en meros proveedores de datos sin procesar para plataformas digitales globales, mientras tienen que pagar por la inteligencia digital generada a partir de sus datos.” (Ib.).

¿Qué hacer?

  1. Promover una nueva cultura de los datos generalizada en los ámbitos público y privado, individual y colectivo, en organizaciones, en sectores económicos, en los servicios públicos, en la gestión pública. Sin datos no hay paraíso, es equivalente a sin conocimiento no hay forma de crear, de transformar, de evitar y de disminuir los riesgos.
  2. Proponer proyectos de datos que sean ágiles, modulares y escalables en lugar de pilotos. Proyectos que descubran el valor de los datos desarrollando sus derivados.
  3. Elaborar planes, programas de formación, investigación e innovación en ciencias cognitivas y en lingüística cognitiva, en paralelo con la ciencia de datos. En los programas de cuarto y quinto nivel integrar maestrías, especializaciones, diplomados, doctorados con líneas de investigación con profesionales en estas ciencias y disciplina, en conjunto con los profesionales de las ciencias sociales y las ciencias naturales.
  4. Prestarle mayor atención y dar todo el apoyo necesario a la producción de los indicadores que permiten hacerle seguimiento a las metas de los 17 ODS de la Agenda 2030 en los países de la región. Ello pasa por aumentar la cooperación y las sinergias en los programas vinculados. Tanto para proyectos tecnológicos de recolección y tratamiento de los datos así como en la formación del talento humano necesario.
  5. Fomentar el desarrollo de contenido en los medios de comunicación social de calidad en relación al tema de los datos. Contenido que sea crítico, resultado de la investigación y el análisis sobre este tema de los datos, que ponga al descubierto la propaganda sobre herramientas y servicios tecnología de información vinculados al tena. Un contenido que promueva el debate sobre la importancia y el valor de los datos.

Haga un comentario