REBI.
Revista Boliviana de Ingeniería
Volumen
4 | No. 1 | Enero - junio 2022
http://doi.org/10.62319/rebi.v.4i1.5
Páginas
27 – 41
ISSN:
2710 - 0901 | ISSN-L: 2710 – 0901
Modelo de regresión
logística para el análisis del riesgo agrícola en la zona Sud del Departamento
de Potosí
Logistic regression
model for the analysis of agricultural risk in the Southern zone of the
Department of Potosí
Delmy Jeanneth
Chirinos Cortez
pt.delmy.chirinos.c@upds.net.bo
https://orcid.org/0000-0003-1128-606X
Universidad Privada Domingo Savio.
Potosí – Bolivia
Recibido
el 12 de agosto de 2021
Arbitrado
el 02 de septiembre de 2021
Aceptado
el 15 de noviembre de 2021
Publicado
el 01 de enero de 2022
http://doi.org/10.62319/rebi.v.4i1.5
RESUMEN
La
regresión logística es un modelo estadístico utilizado para predecir el
resultado de una variable categórica. El objetivo de este artículo es
relacionar una serie de aspectos importantes para la aplicación de un modelo
estadístico a la investigación de la gestión del riesgo agrícola. Se orientó en
la investigación cuantitativa y el paradigma positivista tipo proyectiva,
diseño no experimental, de campo. Utilizando como población la provincia Sud
Chichas, Nor Chichas y Modesto Omiste.
Se emplearon encuestas, análisis de riesgos. Se utilizaron la tabulación de
encuestas mediante el SPSS. Los resultados fueron que las tres provincias
sometidas a estudio cuentan con aproximadamente la misma ponderación en cuanto
a su número de habitantes y se hace notar que no se toma en cuenta los datos
del municipio de Atocha. Se concluye que, la variable dependiente refiere a 0
como la ausencia de la característica que interesa al estudio o llamado también
control y se denota con 1 a la característica presente, vale decir el riesgo
agrícola.
Palabras Clave: Modelo; riesgo; regresión:
logística; agrícola
SUMARY
Logistic regression
is a statistical model used to predict the outcome of a categorical variable.
The objective of this article is to list a series of important aspects for the
application of a statistical model to research in agricultural risk management.
It was guided by quantitative research and the positivist paradigm. Using the provinces of Sud Chichas, Nor Chichas and Modesto Omiste as population. Research and risk analysis
were used. Survey tabulation was used using SPS. The results were that the three
provinces under study have approximately the same weight in terms of number of
inhabitants and it is observed that the data from the municipality of Atocha are not taken into account. It is concluded that the
dependent variable refers to 0 as the absence of the characteristic that is of
interest in the study or also called control and 1 denotes the present
characteristic that is, agricultural risk.
Keywords: Model; risk; Logistic
regression; agricultural
INTRODUCCIÓN
El
modelo de regresión logística para Ouorou et al.,
(2021), es una herramienta estadística ampliamente utilizada en diversos
campos, incluido el análisis del riesgo agrícola. En el contexto agrícola, este
modelo se emplea para predecir y evaluar el riesgo asociado con diferentes
variables que pueden afectar la producción y el rendimiento de los cultivos. Es
importante acotar que, el riesgo agrícola es una preocupación constante para
los productores, ya que están expuestos a una variedad de factores que pueden
impactar negativamente en sus cosechas, como condiciones climáticas adversas,
plagas, enfermedades y fluctuaciones en los precios de los productos.
Por
otra parte, el uso del modelo de regresión logística en el análisis del riesgo
agrícola según Llaugel y Fernández (2021), permite a los
agricultores y expertos identificar y cuantificar la probabilidad de ocurrencia
de eventos adversos, así como comprender mejor las relaciones entre las
variables que influyen en dichos eventos. En el contexto del análisis del
riesgo agrícola, el modelo de regresión logística se utiliza para predecir la
probabilidad de que ocurra un evento específico, como la presencia de una plaga
o una enfermedad en un cultivo determinado. Al incorporar variables relevantes,
como condiciones climáticas, prácticas agronómicas y características del suelo,
el modelo puede proporcionar información valiosa sobre los factores que
contribuyen al riesgo y ayudar a los agricultores a tomar medidas preventivas o
correctivas.
Dentro
de este orden de ideas, la aplicación del modelo de regresión logística en el
análisis del riesgo agrícola en opinión de Camacho (2022), ofrece varias
ventajas significativas. Por un lado, permite una evaluación cuantitativa y
objetiva del riesgo, lo que facilita la toma de decisiones informadas y la implementación
de estrategias de gestión del riesgo más efectivas. Además, al identificar las
variables clave que influyen en el riesgo agrícola, el modelo puede ayudar a
optimizar los recursos y mejorar la resiliencia de
las operaciones agrícolas frente a posibles amenazas.
En
conclusión, el modelo de regresión logística es una herramienta poderosa y
versátil para el análisis del riesgo agrícola. Su capacidad para predecir la
probabilidad de eventos adversos e identificar factores de riesgo clave lo
convierte en un recurso invaluable para los agricultores y profesionales del
sector agrícola. Al integrar este modelo en sus procesos de toma de decisiones,
los actores del sector pueden mejorar la gestión del riesgo, aumentar la
productividad y garantizar la sostenibilidad a largo plazo de sus operaciones
agrícolas.
En
habidas cuentas, existen diversos métodos estadísticos que pueden ser empleados
para analizar la información recolectada en materia de políticas públicas;
entre esos métodos científicos, están los que pertenecen al análisis
multivariado. El propósito del análisis multivariado, es lograr que grandes
cantidades de datos complicados y complejos sean analizados simultáneamente; es
decir, estos métodos tienen como finalidad el de resumir grandes cantidades de
datos en pocas variables que se consideran las más representativas. Estas
técnicas son empleadas en diversos campos de investigación; tanto del sector
público como privado de un país, tocando los diversos ámbitos del saber humano.
En
esta perspectiva, estos métodos estadísticos, tienen diversas modalidades de
uso y García et al., (2020), han dicho que, dependiendo principalmente del tipo
de datos que se desea analizar y tipo de estudio que se desea plantear. En ese
sentido, en muchas investigaciones existe la necesidad de efectuar
procedimientos con métodos de dependencia para el análisis e interpretación de
datos cualitativos y cuantitativos, tomando en cuenta las características
propias de la información. En estos casos, el método multivariado de regresión
logística puede ser de gran ayuda para realizar este tipo de análisis.
Por
otro lado, Camacho (2022), manifiesta que, la regresión logística es un método multivariante que permite estimar la relación existente
entre una variable dependiente no métrica en particular dicotómica y un
conjunto de variables independientes métricas pero dicotomizadas
y por supuesto las variables no métricas y tiene como finalidad modelar la
probabilidad de que una unidad experimental caiga en un grupo particular, con
base en la información medida en la propia unidad, mientras que para Llaugel y Fernández (2021), es apropiada cuando la variable
dependiente es categórica, es decir, nominal o no métrica y las variables
independientes son cuantitativas o cualitativas. En otros casos, la variable
dependiente consta de dos o más grupos o clasificaciones, por ejemplo: sucedió,
no sucedió, éxito o fracaso y una clasificación de tres grupos puede comprender
clasificaciones como: alta, media y baja.
Se
considera la variable dicotómica de recurrencia (se presentó una denuncia de
desastre agrícola más de una vez en una comunidad) y ocurrencia (se presentó
una denuncia de desastre agrícola en la comunidad del departamento de Potosí).
Dicha variable, por su naturaleza misma forma parte de los indicadores
indispensables para construir el Plan Nacional de alerta temprana, en base a la
ocurrencia y recurrencia de factores climáticos, factores sociodemográficos y
productivos de gran interés y a la vez complejidad para los gobiernos en el
mundo.
Se
consideró trabajar con datos de la Zona Sud del departamento de Potosí,
contando para ello con registros administrativos oficiales de 4 de las
estaciones meteorológicas y datos Poblacionales y de agrícolas de los últimos
censos nacionales tanto de población y vivienda como del censo agropecuario,
esta información permitió un análisis representativo.
Este
estudio tiene por propósito analizar la probabilidad el riesgo agrícola en la
Zona Sud del departamento de Potosí, para ello se ha considerado información
desde el año 2013 al 2017 de manera anual, el estudio sirve para la toma de
decisiones y planificación de las acciones propias del Plan Nacional de alerta
temprana.
Considérese
que el Sistema de Alerta Temprana “Es el conjunto de capacidades necesarias
para generar y difundir información de alerta que sea oportuna y significativa,
con el fin de permitir que las personas, las comunidades y las organizaciones
amenazadas se preparen y actúen de forma apropiada y con suficiente tiempo de
anticipación para reducir la posibilidad de que se produzcan pérdidas o daños”
(EIRD, 2009 pág. 34).
El
presente artículo tiene como objetivo relacionar una serie de aspectos
importantes para la aplicación de un modelo estadístico a la investigación de
la gestión del riesgo agrícola. Aunque el análisis multivariante
tiene sus raíces en la estadística univariante y bivariante, la extensión al dominio multivariante
introduce conceptos y cuestiones adicionales, que van desde el valor teórico,
hasta las escalas de medida utilizadas, los errores de medición, los resultados
estadísticos de las pruebas de significación y los intervalos de confianza.
Es
importante acotar que, la utilización de un modelo multivariante
conlleva la elaboración de un plan de investigación bien definido que incluye
los objetivos analíticos en términos conceptuales, la selección del método, la
evaluación de los supuestos básicos de dicho método y sus técnicas, la
estimación del modelo y su interpretación, para finalizar con la aplicación de
las técnicas de validación para determinar la estabilidad de los resultados
obtenidos.
En
este mismo orden, el análisis simultáneo de múltiples características de dichos
individuos, objetos o entes es la característica clave del análisis multivariante, ello porque dicha simultaneidad en el
análisis permite analizar la interrelación existente entre todas las variables
aleatorias que representan dichas características. De lo anterior se deduce que
el carácter multivariante de los métodos englobados
bajo la denominación de análisis multivariante, no
reside tanto en la multiplicidad de variables consideradas en el estudio, como
en la consideración conjunta e interrelacionada de las mismas. Ahora bien, el
objetivo del análisis multivariante es permitir a
quien lo aplique tomar decisiones óptimas en el contexto en que se encuentre,
teniendo en cuenta la información que aporta el conjunto de datos analizado.
Clasificación de los
métodos multivariante
El
análisis multivariante según Barreiro y Castro
(2023), es mediante la descripción de los principales procedimientos que
engloba a los métodos dependientes, interdependientes y estructurales, estos
autores presentan la clasificación mediante la figura 1:
Figura
1
Clasificación de los métodos multivariante
Métodos de
dependencia:
Análisis
de regresión: Supóngase que en el problema objeto de estudio se tiene una
variable dependiente (Y) y una colección de variables independientes que se
suponen explicativas de la anterior bajo una forma lineal o linealizable
(X1, X2,...,Xn)
Si
tanto la variable a explicar cómo las variables “explicativas” son
cuantitativas y los datos relativos a las últimas conforman una matriz de rango
completo, la técnica que, entre otras cosas, proporciona la relación lineal de
Y con X1, X2,...,Xn, o en otros términos, que permite
predecir los cambios en el valor de en respuesta a los cambios en los valores
de X1, X2,...,Xn), o, lo que es lo mismo, la
"explicación" del comportamiento de la variable de nuestro interés
mediante la información suministrada por una serie de variables de las que se
supone depende linealmente, se denomina regresión múltiple. El modelo de
regresión múltiple viene dado por yi = β0 + β1χ1i +
β2χ2i +... + βpχpi + еi o,
en términos matriciales, Υ = Xβ + е, donde X es una matriz de cantidades conocidas
y de rango completo y la inclusión del término de error se justifica por la
omisión en el modelo de variables explicativas relevantes o errores de medida.
Métodos de
independencia:
Análisis
de componentes principales ACP: el análisis de componentes principales examina
las relaciones entre un conjunto de p variables correlacionadas y las
transforma en un nuevo conjunto de variables incorreladas
denominadas componentes principales. Estas nuevas variables son combinaciones
lineales de las originales y se derivan en orden de importancia, de tal manera
que la primera componente principal recoge, de la variación total de los datos
originales, la mayor parte posible. Y así sucesivamente. Esta técnica es
originaria de K. Pearson (1901) y fue desarrollada posteriormente por Hotelling (1933, 1936). Su objetivo fundamental es ver si
unas pocas componentes recogen la mayor parte de la variación de los datos
originales. Si es así, se puede argüir que la dimensionalidad
del problema no es p sino inferior a p. En la práctica no siempre es fácil la
identificación de las componentes principales por lo que su principal uso recae
en la reducción de la dimensionalidad de los datos
para simplificar posteriores análisis. Por ejemplo, es una manera muy útil de
encontrar agrupaciones en los datos cuando estos vienen caracterizados por un
elevado número de variables.
Métodos estructurales:
Los
modelos de ecuaciones estructurales permiten describir, gráfica y
analíticamente, las relaciones que se cree que existen entre las variables
observables y las no observables, teniendo en cuenta la dirección de cada una
de tales relaciones. A partir de la información muestral,
se pueden estimar tales relaciones y juzgar su importancia, de tal manera que
se puede simplificar el diagrama inicial representativo de las posibles
relaciones hasta obtener un modelo parsimonioso.
Un
aspecto clave en la estimación de cualquier tipo de modelo estadístico es su
sujeción al planteamiento de una teoría debidamente asentada en el área de
conocimiento en que se esté trabajando. Este requisito es especialmente
importante en un área de modelización tan flexible como ésta. Por ello, se debe
prestar una gran atención a la especificación e identificación del modelo. El
primer aspecto se refiere al correcto planteamiento del sistema de ecuaciones
en función de la teoría subyacente (cumplimiento de supuestos básicos,
definición de algunos parámetros como fijos y otros como libres o estimables);
el segundo aspecto tiene que ver con que la cantidad de información disponible
sea suficiente para tener una estimación única de los parámetros libres, más de
una o ninguna.
Entre
las bases teóricas en este artículo, se encuentra el análisis de regresión
logística, según Camacho (2022), es una herramienta valiosa para comprender y
predecir eventos categóricos, como el riesgo agrícola, al proporcionar
información sobre las relaciones entre variables y estimar probabilidades de
ocurrencia. Su aplicación permite tomar decisiones informadas y gestionar
eficazmente situaciones donde la variable dependiente es discreta o categórica.
Así
mismo, el análisis de regresión logística presenta unas características
específicas que según Álvarez et al, (2021), son: el modelo estadístico
específico, se utiliza cuando la variable dependiente es categórica, como la
presencia o ausencia de un evento. Igualmente, la probabilidad como resultado,
aquí se estima la probabilidad de que ocurra un evento en función de las
variables independientes. También una de las características es la función logística,
esta emplea la función logística para transformar la salida en una probabilidad
entre 0 y 1 y por último los coeficientes logarítmicos, es decir, los
coeficientes de regresión representan el cambio en el logaritmo de las
probabilidades.
Por
su parte, Llaugel y Fernández (2021), manifiesta que
los objetivos del análisis de regresión logística, están compuesto por la
predicción de probabilidades, el cual se encarga de determinar la probabilidad
de ocurrencia de un evento en función de las variables productoras, otro
objetivo es la identificación de factores significativos, donde se identifica
qué variables independientes influyen significativamente en la variable
dependiente. Así también habla de la evaluación del riesgo, es decir del
análisis y cuantificación del riesgo asociado con diferentes variables en un
contexto específico, como el riesgo agrícola. Y finalmente, la clasificación
binaria, adecuado para problemas de clasificación binaria con dos posibles
resultados.
El
análisis de regresión logística tiene la misma estrategia del análisis de
regresión múltiple, el cual se diferencia esencialmente del análisis de
regresión logística porque la variable independiente es métrica; en la práctica
el uso de ambas técnicas tiene mucha semejanza, aunque sus enfoques matemáticos
sean diferentes. La variable dependiente o respuesta no es continua si no
discreta, generalmente toma valores de 1, 0. Las variables explicativas pueden
ser cuantitativas o cualitativas y la ecuación del modelo no es una función lineal
de partida, si os
La regresión
logística como técnica multivariada exploratoria y predictiva
La
regresión logística como método estadístico, es apropiado cuando la variable
dependiente es categórica y las variables independientes son o no métricas, ha
sido reconocida su capacidad y poderío en el análisis de datos en diversas
áreas científica como, la medicina, la agroecología, la economía, las ciencias
sociales, etc. permite la predicción de pertenencia de la unidad de análisis a
uno de los grupos pre establecidos.
Regresión logística
simple
Este
modelo tiene la forma de:
De
esto se deduce que:
Por
tanto no pude tener distribución normal debido a
que toma valores discretos, el modelo de regresión lineal simple, no es
aplicable para el caso de variables respuesta de tipo dicotómico. En el
análisis de regresión lineal simple, el punto principal del proceso de
estimaciones del modelo es un gráfico de dispersión de la variable respuesta
versus la regresora, pero este grafico resulta
limitado cuando hay solo dos valores posibles para la variable respuesta por
tanto se debe usar otros gráficos, estos resultan de la suavización de los
valores de la variable respuesta, representando después los valores de la
variable respuesta versus la regresora
Sea:
Que
presenta la media condicional de y=1 dado x donde π(x) ,0 y 1 dado a x, representa la probabilidad de que ocurra y=1,
ciertamente tenga relación lineal dentro el rango de la variable regresora. De la relación π(x) y x para valores intermedios de x. se espera una
relación curvilínea. Para cualquier valor grande de x, π(x)
tomará valores cercanos a 1 y para valores cercanos de x, π(x)
tomara valores cercanos a cero. Curva en forma de S o signoide que tiene las propiedades requeridas para
π(x) y que tiene las propiedades de una
función de distribución de probabilidades acumuladas.
Para
esta probabilidad se usa la función de distribución acumulada de la
distribución logística dado por:
Tiene, cuando y cuando
además este modelo toma valores en el
intervalo [0, 1]. Cuando P [Y = 1] = 0.5 el valor de x es: que brinda información muy útil. Una
transformación de que es lo central del estudio de la regresión
logística es la transformación Logit, transformación
que se define en términos como:
Lo
importante de esta transformación es que tiene muchas propiedades semejantes al
modelo de la regresión lineal simple, por ejemplo, son lineales sus parámetros,
puede ser continua y pude tomar cualquier valor real dependiente de x. Para el
modelo de la regresión lineal simple, la variable respuesta se expresa como:
Para la variable respuesta dicotómica
la expresamos como:
Entonces, que ocurre con este modelo.
Entonces
tiene una distribución binomial con media cero
y varianza Por tanto la distribución
condicional de la variable respuesta tiene distribución de probabilidades
binomial con media . El lado izquierdo se llama también logaritmo
de ODDS ratio o razón de ventaja a favor de éxito o también razón de
probabilidad de y =1 contra y = 0 específicamente.
Se
denota en el modelo logístico como (ODDS)
a la ocurrencia de eventos, esta razón se define como el cociente de la
probabilidad de que el evento ocurra a la probabilidad de que el evento no
ocurra.
Gráfica 1
Gráfica de la
regresión logística
En
general, la gráfica de una función de distribución es, una función de
distribución es una función real de variable real: (Rojo, J. M, Pág. 5)
F: R → R
De forma que verifica:
Está acotada en el intervalo [0,1]
0 ≤ F(x) ≤ 1 ∀ x
Es monótona no decreciente:
1 2 x ≤ x ⇒ ( ) ( ) 1 2 F x ≤ F x
Y, además, está definida en todo R,
tomando los siguientes valores:
F (−∞) = 0
F (+∞) = 1
Riesgo
Es
la probabilidad de ocurrencia de uno o varios eventos adversos que pudiesen
ocasionar lesiones o pérdida de vidas, afectación a propiedades, a la
producción de alimentos y el medio ambiente, y la detención de la actividad
económica en un lugar y periodo de exposición determinado. Por otro lado, para
Andrade y Arteaga (2021), Los riesgos son eventos o situaciones que pueden
tener consecuencias negativas para las personas, empresas y sociedad en
general. Estos pueden ser causados por diversas razones como errores humanos,
desastres naturales, accidentes de tránsito entre otros.
Riesgo agrícola
La
Organización para la Cooperación y el Desarrollo Económicos (OCDE), 2023 y el
Departamento de Agricultura de Estados Unidos (USDA) advierten sobre los
riesgos en la agricultura en sus respectivas páginas web. La preocupación está
justificada. Como apuntan desde la oficina norteamericana, “el riesgo es un
aspecto importante del negocio de la agricultura”, pues incertidumbres
referentes a las condiciones meteorológicas, los rendimientos, los precios, las
políticas gubernamentales, los mercados globales y otros factores pueden
provocar fallas en los ingresos agrícolas. Para el USDA, “la gestión del riesgo
consiste en elegir entre alternativas que reducen los efectos financieros que
pueden derivarse de tales incertidumbres”. Organización para la Cooperación y
el Desarrollo Económicos (OCDE) y el Departamento de Agricultura de Estados
Unidos (USDA), (Website: www.ceigram.upm.es, consultado
2019). Así, desde el Departamento norteamericano distinguen cinco tipos
generales de riesgo: riesgo de producción, riesgo de precio o mercado, riesgo
financiero, riesgo institucional y riesgo personal o humano. El que compete al
estudio es el riesgo de producción, que tiene que ver con la incertidumbre que
provoca el crecimiento de los cultivos y el ganado. Dentro de este tipo de
riesgo, factores como el tiempo, las enfermedades o las plagas pueden provocar
mermas en la calidad y la cantidad de las cosechas.
METODOLOGÍA
Este
artículo tiene como objetivo relacionar una serie de aspectos importantes para
aplicar un modelo estadístico en la investigación de la gestión del riesgo
agrícola. Para ello, se adoptó un enfoque cuantitativo y se propuso un modelo
estadístico basado en el enfoque proyectivo descrito por Hurtado (2006).
El
diseño de la investigación se clasificó como no experimental, ya que no se
manipularon deliberadamente las variables y se observaron los fenómenos en su
entorno natural para su posterior análisis, siguiendo la definición de
Hernández et al. (2014). La población seleccionada para el estudio fue la Zona
Sud del Departamento de Potosí, Bolivia, específicamente las provincias Sud
Chichas, Nor Chichas y Modesto Omiste.
Con
el fin de alcanzar el objetivo establecido, se llevaron a cabo encuestas y
análisis de riesgos. Las encuestas se tabularon utilizando el software SPSS.
Además, se realizó una confrontación de factores y una calificación ponderada,
así como un análisis de maquinarias.
RESULTADOS
A continuación, en el gráfico 2, inicia la
descripción de los resultados de la investigación:
Gráfico
2
Habitantes por provincia, zona sud Potosí
El
gráfico señala que las tres provincias sometidas a estudio cuentan con
aproximadamente la misma ponderación en cuanto a su número de habitantes y se
hace notar que no se toma en cuenta los datos del municipio de Atocha
correspondiente a la provincia Sud Chichas, por no contar con datos registrados
tanto climáticos como de reportes de desastres agrícolas en los años
comprendidos entre el 2013 y 2017. Por
otro lado, se evidencia su poca incidencia en el sector agrícola.
Grafico
3
Población dedicada a la agropecuaria y miembros de
la UPA dedicada a la agricultura
El
gráfico muestra que el municipio de Cotagaita involucra poblacionalmente y en
número de miembros de cada Unidad productiva Agropecuaria a una mayor cantidad
de personas, le sigue Tupiza con población cercana a las 6.000 personas, le
sigue Vitichi con más de 5.000 personas dedicadas a
la actividad agropecuaria y con miembros dentro de la UPA que superan las
2.000, Villazón no supera a los 4.000 habitantes
dedicados a la agropecuaria y sus UPA están
cercanas a las 3.000 Finalmente,
destaca el insipiente aporte a la agricultura por parte del municipio de
Atocha, municipio que queda fuera del alcance del presente estudio.
Del
gráfico se puede determinar que la provincia Nor
Chichas compuesta por los municipios de Cotagaita y Vitichi
cuenta con mayor población dedicada a la agropecuaria al igual que el número de
sus unidades productivas dedicadas exclusivamente a la agricultura. Por el contrario,
Sud Chichas, presenta un caso extremo que señala una escasa población e
unidades productivas dedicadas a la agricultura, Modesto Omiste
por sus características topográficas y climáticas muestra una actividad
disminuida en cuanto a población e unidades productivas dedicadas a la
agricultura. La tabla 1 corresponde a los Eventos adversos en Bolivia:
Tabla
1
Bolivia: Eventos adversos de origen natural
reportados, según tipo de evento (En número de reportes)
Fuente:
Instituto Nacional de Estadística (2013)
Se
encontró que, los eventos más frecuentes en Bolivia son las inundaciones que
representan el 42% de los registrados entre el 2002 y el 2013, le sigue con un
17% las sequías, con un 17% también están presentes las heladas, que son más
propias de la zona andina del país, el restante 6% corresponde a los
deslizamientos, vientos huracanados, incendios. Esto se conoció en base a los
reportes del entonces Viceministerio de Defensa Civil – INE que las pérdidas
por el fenómeno El Niño en los años 1983 – 1984 representó el 15,3% del PIB.
El
Niño en los años 2015-2016 ha afectado a 72.000 familias y 30.000 Ha. de diferentes
cultivos. Las inundaciones en los años 2013 y 2014 causaron pérdidas por más de
$US 111 millones. Esta información, nos muestra la incidencia económica que
tiene la agricultura en la evolución del PIB, siendo por tanto imperativo
atender la gestión de riesgo agrícola.
El
pronóstico del tiempo (determinístico y limitado en su horizonte temporal) se
separa conceptualmente del pronóstico del clima (necesariamente
probabilístico). Entendemos por pronóstico del clima, la predicción de los
valores medios, dispersión y valores extremos de variables meteorológicas en
escalas de tiempo mayores, vale decir, meses, estaciones, años, etc.
Tabla
2
Resumen de procesamiento de casos
Casos sin ponderara |
N |
Porcentaje |
|
Casos seleccionados |
Incluido en el análisis |
68 |
100,0 |
Casos perdidos |
0 |
,0 |
|
Total |
68 |
100,0 |
|
Casos no seleccionados |
0 |
,0 |
|
Total |
68 |
100,0 |
a.
Si la ponderación está en vigor, consulte la tabla de clasificación para el
número total de casos.
La
tabla muestra que son 68 las comunidades analizadas, aclarando que corresponden
a las provincias Nor Lipez,
Sud Lípez y Modesto Omiste
que corresponden a la zona sud del departamento de Potosí. No existen casos
perdidos o datos faltantes.
Tabla 3.
Codificación
de Variable Dependiente
Valor original |
Valor interno |
Control |
0 |
Riesgo Agrícola |
1 |
La variable dependiente refiere a 0 como la ausencia de la
característica que interesa al estudio o llamado también control y se denota
con 1 a la característica presente que interesa analizar, vale decir el riesgo
agrícola.
Tabla 4
Codificaciones de variables categóricas
|
Frecuencia |
Codificación de parámetro |
|
(1) |
|||
% Perdido superficie
aproximado |
menor al valor promedio |
25 |
1,000 |
mayor al valor promedio |
43 |
,000 |
|
Ingreso Familiar (Bs.) |
menor al valor promedio |
48 |
1,000 |
> al valor promedio |
20 |
,000 |
|
Helada |
ocurrente |
34 |
1,000 |
recurrente |
34 |
,000 |
|
Sequía |
ocurrente |
62 |
1,000 |
recurrente |
6 |
,000 |
|
Haba |
ocurrente |
63 |
1,000 |
recurrente |
5 |
,000 |
|
Papa |
ocurrente |
44 |
1,000 |
recurrente |
24 |
,000 |
|
Hortalizas |
ocurrente |
65 |
1,000 |
recurrente |
3 |
,000 |
|
Frutales |
ocurrente |
51 |
1,000 |
recurrente |
17 |
,000 |
|
Maíz |
ocurrente |
21 |
1,000 |
recurrente |
47 |
,000 |
|
Población (hab) |
menor al valor promedio |
49 |
1,000 |
> al valor promedio |
19 |
,000 |
Se puede ver en esta tabla la frecuencia absoluta de cada valor, siendo
dicotómica la característica estudiada para cada variable referida a algún
factor que incide en el riesgo agrícola en la zona sud del departamento de
Potosí. Por ejemplo, se verifica que 25 observaciones han perdido en porcentaje
aproximado de superficie cultivada, menos del valor promedio calculado, en
cambio son 43 comunidades las que no han perdido en porcentaje igual o mayor al
valor promedio de dicha variable. El ingreso familiar promedio menor a su media
aritmética es de 48 comunidades y en cambio son 20 las comunidades que
registran un ingreso familiar que en promedio es igual o mayor a la media
aritmética.
En cuanto al registro de heladas se verifica que se han distribuido en
exactamente a la mitad cada caso, siendo 34 las comunidades que han reportado
heladas y otras 34 comunidades de la zona sud que reporta heladas, pero de
manera recurrente. Existen 62 comunidades que presentaron sequía, pero han sido
6 las comunidades que han tenido este evento climático de manera recurrente.
El reporte de daño a su producción de haba por una sola vez representa a
63 comunidades, en cambio han sido 5 las comunidades que de manera reiterativa
o recurrente han reportada la afectación a este cultivo. Son 44 comunidades que
reportan daño en la papa por una sola vez en este periodo estudiado, sin
embargo 24 comunidades señalaron que la afectación a la papa ha sido
reiterativa.
En cuanto a las hortalizas el daño registrado por una única vez ha sido
establecido en 65 comunidades, sin embargo 3 comunidades reportan recurrente la
afectación en su producción de hortalizas. Acerca de los frutales se observa
que el hecho fue denunciado por 51 comunidades, pero solo 17 comunidades tienen
este problema de manera recurrente. El reporte de daño a la producción de maíz
se dio en 21 comunidades, pero fueron 47 las comunidades que tuvieron este
problema de manera recurrente. En cuanto a la población, la tabla muestra que
49 comunidades tienen en promedio una población inferior al promedio
establecido para la zona sud del departamento de Potosí.
DISCUSIÓN
El
método multivariado de la regresión logística ha permitido explorar y
pronosticar para la población estudiada, además de caracterizar el comportamiento
del riesgo agrícola en la zona sud del departamento de Potosí, se logró conocer
como respuesta científica la probabilidad del riesgo agrícola, así mismo, el
uso importante del modelo es clasificar en forma global a las comunidades de
las provincias Nor Chichas, Sud Chichas y Modesto Omiste en una de las
2 alternativas: tiene riesgo agrícola
versus no tienen riesgo agrícola.
Lo
establecido, se obtiene sustituyendo los valores de las variables
independientes en el modelo ajustado, lo que produce la probabilidad estimada,
para predecir si la comunidad está en la alternativa 0 o 1, el software SPSS
v.22 automáticamente emplea un punto de corte de 0,5. Esto significa que la comunidad con
probabilidad estimada < 0,5 se clasifica como (ocurrencia-ausencia) = 0
(Control) en cambio se clasifica >
0,5 si la probabilidad estimada señala (recurrencia-presencia) = 1(riesgo
agrícola) en la zona sud del departamento de Potosí, que es la que comprende
este estudio. En resumen, el modelo final ha sido clasificado correctamente 90
% de las comunidades con riesgo agrícola y un 50 % de las comunidades que no
evidencian riesgo agrícola. El porcentaje global de las comunidades
clasificados correctamente es de 79,4 %.
De
las 10 variables independientes, consideradas inicialmente para el modelo de
regresión logística, se obtuvo el modelo ajustado luego del tratamiento bajo el
método de Wald, quedando para el modelo solo los
coeficientes que pasaron la prueba de significancia de sus coeficientes
individuales con un nivel de confianza del 95%.
Se
puede afirmar en base a los datos analizados que el perfil del riesgo agrícola
en la zona sud del departamento de Potosí está influido en gran manera por los
reportes de daño a frutales y por el
reporte de heladas, estas serían las causas del riesgo agrícola y por tanto en
ello podemos intervenir o incidir en la realidad agrícola.
Dentro
de la construcción del modelo, se desestima
la incorporación de las variables que detalla la tabla, pues no aportan
de acuerdo a criterio teórico a la comprensión del fenómeno estudiado.
CONCLUSIONES
El modelo de
regresión logística tiene un basamento teórico importante y adecuado para el
análisis del riesgo agrícola. La regresión logística ofrece un instrumento
técnico estadístico útil a corto plazo para establecer la existencia de riesgo
agrícola en la zona sur del departamento de Potosí.
El tratamiento de
datos estadísticos de riesgo agrícola es esencial para contribuir en la
construcción del Sistema de Alerta Temprana. El método de regresión logística
permitió el conocimiento en términos probabilísticos del riesgo agrícola en la
zona sud del departamento de Potosí.
Con los resultados de
la regresión logística, mediante el estadístico de Wald
para el riesgo agrícola, se determinó que las variables más influyentes son:
“Reporte de heladas” y “Daño a los frutales”, teniendo estas variables un
p-valor asociado al estadístico de Wald menor al 5%.
Las variables con
poca influencia en el modelo son: la
población, el ingreso familiar por mes, los reportes de sequía, el daño al
haba, el daño a la papa, el daño al maíz y el daño a las hortalizas, así como
el porcentaje de daño en la superficie cultivada.
Los datos son
altamente orientadores y favorecen medidas resilientes
y nos preparan para la construcción de un sistema de alerta temprana. En
estudios futuros de la zona geográfica se deberá tomar especial interés a los
eventos climáticos de la helada y considerar que el producto agrícola
importante en este modelo son los frutales.
Se prueba que la
regresión logística ha permitido el tratamiento de datos cualitativos y ha
presentado la posibilidad de reducir el costo del tratamiento de información en
base a las variables más determinantes identificados en el modelo de regresión
logística.
Los resultados de
este trabajo ayudan a que las entidades gubernamentales observen qué se puede
hacer para que las comunidades se anticipen al riesgo agrícola y por tanto su
vulnerabilidad en diferentes factores como en su economía familiar que luego
afectará al PIB nacional. Es evidente que son diversos
y complejas las variables que influyen en el riesgo agrícola por lo que este
trabajo es el inicio de un abordaje más profundo en el ámbito del análisis
multivariado.
REFERENCIAS
Álvarez,
C. Herrera, M., Herrera, E., y Araya, G.
(2021). Investigation of Variables that Determine Levels of
Self-Esteem in Central American Schoolchildren:
A Binary Logistic Regression Model. MHSalud, 18(2). 1-22. DOI:
https://doi.org/10.15359/mhs.18-2.2
Andrade,
G., y Arteaga, M. (2021). Riesgos laborales: Causas y consecuencias en tiempos
de Covid-19. Revista Dominio de las Ciencias, 7(3). 247-265.
http://dominiodelasciencias.com/ojs/index.php/es/index
Barreiro
M., y Useche, L. (2023). Métodos multivariantes
para la construcción de índices compuestos en la gestión cultural: una revisión
de la literatura. Minerva Journal, 9(10). 31-39.
https://doi.org/10.47460/minerva.v4i10.93
Camacho,
J. (2022). Análisis de regresión logística aplicado al modelamiento espacial de
las causas de deforestación en el departamento del Guaviare durante el periodo
2005-2020 y proyección de escenarios de deforestación a 2030.” Cuadernos de
Geografía: Revista Colombiana de Geografía 31(2). 255-280.
https://doi.org/10.15446/rcdg.v31n2.98012
Departamento
de Agricultura de Estados Unidos. (21 de abril de 2019). El Departamento de
Agricultura de los Estados Unidos (USDA) Extiende su Iniciativa del Strike Force para impulsar el Crecimiento Rural y Oportunidades
para Construir Economías Rurales.
https://www.usda.gov/media/news-archives/informacion-y-servicios-del-united-states-department-agriculture-usda-por-sus
García,
R. García, G. González, D., y García, R. (2020). Modelo de regresión logística
para estimar la dependencia según la escala de Lawton y Brody.
Medicina de Familia. SEMERGEN, 36(7). 365-371. https://www.elsevier.es/es-revista-medicina-familia-semergen-40-articulo-modelo-regresion-logistica-estimar-dependencia-S1138359310001322
Hernández,
R., Fernández, C. y Baptista, P. (2014). Metodología de la investigación.
México: Mc Graw Hill.
Hurtado,
J. (2006). El Proyecto de Investigación. Metodología de la investigación
Holística. 4ª Edición ampliada. Quirón, Sypal,
Caracas. 168 pp.
https://www.geocities.ws/inesotilia28873/fase3/t3m3.html
Llaugel, F., y Fernández, A. (2021).
Evaluación del uso de modelos de regresión logística para el diagnóstico de
instituciones financieras. Revista Ciencia y Sociedad, 36(4). 590-627.
file:///Evaluacion_del_uso_de_modelos_de_regresion_logisti.pdf
Organización
para la Cooperación y el Desarrollo Económicos. (06 de julio 2023). Informe
OCDE-FAO Perspectivas agrícolas 2023-2032 describe las principales tendencias
en la producción, el consumo y el comercio.
https://www.fao.org/venezuela/noticias/detail-events/fr/c/1644151/
Ouorou, M. Aleixo,
J., Caraciolo, R., y Álvarez, D. (2021). Modelos de
Regresión Logística Multinomial Ordinal y Redes
Neuronales Artificiales para la clasificación de madera aserrada. Revista
Forestal Mesoamericana Kurú, 18(43).29-40. file:///Dialnet
ModelosDeRegresionLogisticaMultinomialOrdinalYRede-8131067.pdf