Recolección de datos

La recopilación de datos, segunda fase de la investigación estadística, consiste en aplicar procedimientos clave para obtener la información necesaria en un estudio.

Este proceso se basa en dos aspectos fundamentales: la fuente de los datos y los métodos empleados para su recolección.

1) Fuentes de obtención de datos

Existen dos métodos básicos con los cuales el investigador puede obtener los datos deseados:

  • Recurrir a fuentes de información gubernamentales, industriales o individuales. 
  • Diseñar un experimento para obtener los datos necesarios.

1.1) Fuentes de información

Una fuente de información es el origen de los datos necesarios para cada variable o aspecto de la investigación, ya sea una persona, institución o lugar. Según su finalidad, las fuentes se clasifican en primarias, cuando los datos se obtienen directamente, o secundarias, cuando provienen de registros o estudios previos.

1.1.1) Fuente de información primaria

Una fuente de información primaria se obtiene directamente de la unidad de observación y se genera exclusivamente para un estudio, ya que no existe previamente. El investigador debe recopilarla mediante distintos métodos. 

Un ejemplo es el INEI, que realiza censos para recoger datos demográficos, sociales y económicos de la población peruana en un período determinado.

1.1.2) Fuente de información secundaria

Una fuente de información secundaria se elabora a partir de datos obtenidos de fuentes primarias, permitiendo optimizar recursos y reducir el tiempo y costo de la investigación. Estas fuentes contienen información recopilada con un propósito distinto al del estudio actual. Por ejemplo, un estudiante puede utilizar informes técnicos, documentos oficiales, revistas, artículos científicos, tesis o monografías para desarrollar su investigación.

Además, tanto las fuentes primarias como secundarias pueden clasificarse según su origen en internas o externas.

1.1.3) Fuente de información interna

Una fuente de información interna corresponde a los datos recopilados dentro de una empresa o institución a partir de su propia gestión. Esta información proviene de distintos departamentos, como administración, contabilidad, comercial y técnico. Ejemplos de fuentes internas incluyen reportes financieros, operativos y análisis específicos sobre producción, ventas, compras y estados financieros.

1.1.4) Fuente de información externa

Las fuentes de información externas corresponden a datos estadísticos generados por instituciones de investigación, ya sean públicas o privadas, o por dependencias especializadas. Estos datos suelen ser requeridos a nivel nacional o sectorial.

1.2) Diseño experimental

El diseño experimental es un método de obtención de información recomendado para construir modelos explicativos, aunque su complejidad estadística lo hace más común en textos avanzados.

Este enfoque consiste en la manipulación intencional de una o más variables independientes para evaluar su impacto en una o más variables dependientes, dentro de un entorno controlado por el investigador.

El modelo explicativo busca comprobar la relación entre variables para ofrecer una interpretación del fenómeno estudiado, permitiendo así contrastar o demostrar hipótesis.

2) Métodos de recolección

Los métodos de recolección de datos a partir de fuentes primarias se dividen en dos procedimientos fundamentales: la observación y el interrogatorio.

2.1) La observación

La observación es el método clásico para la recopilación de datos, ya que permite comprender la realidad objetiva mediante la percepción directa del objeto de estudio. Por otro lado, la observación científica se caracteriza por ser un proceso consciente, planificado y objetivo, en el que se percibe directamente el fenómeno estudiado.

Sus principales ventajas son:

  • Permite observar el fenómeno de forma objetiva y directa.
  • Facilita el acceso inmediato a la información.
  • Fomenta el descubrimiento de nuevos aspectos de interés.
  • Puede combinarse con otros métodos para mayor precisión.

No obstante, presenta algunas desventajas:

  • Requiere personal especializado.
  • Resulta costosa y poco viable para el estudio de grandes poblaciones.
  • No permite recopilar información sobre eventos pasados o futuros.

La observación puede ser:

  • Simple (espontánea y sin prejuicios) o sistemática (planificada y controlada).
  • Participativa (el observador se integra al grupo) o no participativa (se mantiene externo).
  • Abierta (los sujetos saben que son observados) o encubierta (desconocen la observación, favoreciendo la objetividad).

2.2) El interrogatorio

El interrogatorio es un método para obtener información mediante preguntas dirigidas a las personas objeto de estudio. Se clasifica en:

  • Directo: A través de entrevistas (censos, encuestas).
  • Indirecto: Mediante cuestionarios que el interrogado completa por sí mismo.

La entrevista permite complementar la información con la observación directa, pero factores como la personalidad del entrevistador, su entonación o la formulación de preguntas pueden influir en las respuestas. 

El cuestionario es más económico, pero se limita a preguntas simples y puede presentar problemas como la falta de respuesta o el llenado incorrecto.

Ventajas del interrogatorio:

  • No requiere personal especializado.
  • Es adecuado para estudios a gran escala.
  • Permite recopilar información sobre aspectos subjetivos, hechos pasados o inquietudes futuras.

Desventajas del interrogatorio:

  • Depende de la memoria del interrogado.
  • Está condicionado por la disposición y motivación del participante.
  • La formulación y el tipo de preguntas pueden influir en las respuestas.

Para reducir errores en la formulación de preguntas, estas deben ser claras, concisas, neutrales y evitar ambigüedades, presuposiciones o sugerencias implícitas.

Los métodos para la recopilación de información también pueden clasificarse según su frecuencia en:

  • Métodos de recolección ocasional, como las encuestas.
  • Métodos de recolección periódicos, como los censos.
  • Métodos de recolección continuos, como los registros.

2.3) Encuestas

La encuesta es un método estructurado de recopilación de información con un propósito específico y un alcance limitado. Un ejemplo es la ENAPROM (Encuesta Nacional de Propósitos Múltiples), realizada por el INEI en 1977-1978. Se clasifica en retrospectiva y prospectiva.

2.3.1) Encuesta retrospectiva

Se basa en datos previos para identificar características históricas. Por ejemplo, al estudiar a personas con cáncer de pulmón, se investiga retrospectivamente si tenían antecedentes de tabaquismo o exposición a riesgos industriales.

2.3.2) Encuesta prospectiva

Parte de una muestra representativa y analiza características a lo largo del tiempo. Por ejemplo, al estudiar a un grupo de personas con hábito de fumar, se observa si con el tiempo desarrollan cáncer de pulmón.

2.4) Censos

El censo es un proceso de recopilación, análisis y difusión de datos demográficos, económicos y sociales de toda la población de un país o territorio en un momento determinado. Su principal objetivo es proporcionar información estadística esencial para la planificación en áreas como alimentación, educación y salud.

Por ejemplo, el Censo Nacional 2017 de Perú - población, vivienda y comunidades indígenas

2.5) Los registros

Los registros son procesos continuos que monitorean los cambios poblacionales, incluyendo nacimientos, inmigración, emigración y fallecimientos.

Por ejemplo, el informe "Perú, Evolución de las Entradas y Salidas Internacionales 2024" del INEI se basó en datos migratorios registrados por la Superintendencia Nacional de Migraciones.

Comentarios

Entradas más populares de este blog

La Estadística

Muestreo