Aplicación de software R á resolución dun exercicio sobre estatística económica e finanzas empresariais
Diego Sande Veiga e Víctor Sande Veiga
Profesores de Organización e Xestión Comercial e de Informática
diego.sande.veiga@edu.xunta.gal
1. Contextualización
É xeralmente recoñecido que a innovación se alimenta do intercambio de coñecemento (Lundvall, 1992; OECD, 1996) e a interdisciplinariedade é unha fonte que pode xerar innovacións de tipo disruptivo (Van Oort & Cortinovis, 2015; Harvard Deusto Business Review; EAE Business School, 2015). No ámbito educativo, a innovación pode entenderse de dúas maneiras: como a adopción e introdución no proceso educativo de algo que xa existe noutro ámbito ou como resposta á solución dun problema determinado (Ramírez; 2012). Atendendo a esta definición, nace esta proposta didáctica interdisciplinaria entre o ámbito da xestión económica e da informática. A súa utilidade e aplicabilidade enmárcase nos módulos de Xestión Financeira (CS Administración e Finanzas), Sistemas de Xestión Empresarial (CS Desenvolvemento de Aplicacións Multiplataforma) ou Financiamento Internacional (CS Comercio Internacional), aínda que a súa utilidade para a análise de resultados empresariais é extensible a outras familias profesionais.
2. Introdución
O emparellamento por puntuación de propensión (PSM, do inglés Propensity Score Matching) é unha técnica estatística empregada para avaliar resultados de variables ante un suceso aleatorio. O emprego desta técnica require o uso de software estatístico e o coñecemento do código empregado.
O PSM é unha técnica estatística de coincidencia que tenta estimar o efecto dun tratamento, unha política (subvencións etc.) ou outra intervención por conta das covariables que predín que recibe o tratamento. O PSM tenta reducir o trazo debido á confusión das variables que se poden atopar nunha estimación do efecto do tratamento obtido da simple comparación dos resultados entre unidades que recibiron o tratamento fronte ás que non o fixeron. A técnica foi publicada por primeira vez por Paul Rosenbaum e Donald Rubin (1983).
Emparellamento por puntuación de propensión
3. Parte experimental
A implementación dun programa informático ten como obxectivo a automatización da resolución dun determinado problema. Neste caso preténdese acadar a reproducibilidade da resposta ao problema de emparellamento por puntuación de propensión de xeito determinista.
Reproducibilidade
Con este fin, preséntase o algoritmo e o procedemento para solucionar o problema en cuestión utilizando calquera conxunto de datos personalizados cun formato determinado.
Utilízase a linguaxe de programación R, linguaxe cun enfoque estatístico e amplamente usada en contornas de investigación, para codificar o devandito algoritmo.
3.1. Datos de partida
O conxunto de datos que se empregarán como entrada do algoritmo son os seguintes:
- Datos de ingresos para o exercicio 2020 dunha mostra de empresas que participan nunha política económica.
- Datos de ingresos para o exercicio 2020 dunha mostra de empresas que non participan nunha política económica.
3.2. Material
Empregarase o seguinte material:
- Computador
3.3. Programas e aplicacións informáticas necesarias
- Paquete de ofimática (Office, Libre Office ou similar)
- Editor de texto (Bloc de notas, Gedit ou similar)
- Software R e R-Studio cos paquetes MatchIt (método nearest neighbor) e Tableone.
3.4. Preparación dos datos para a análise
A entrada de datos require dun formato específico para o correcto funcionamento do código presentado. En particular, os datos deben presentarse nun ficheiro de texto plano e tabulados en dúas columnas. A primeira liña do arquivo contén os títulos das columnas, que se corresponden co nome das nosas variables («tipo» e «Inge_2020»).
A primeira columna, á que chamaremos «tipo», contén os datos da participación dunha empresa nunha determinada política de forma binaria. Os valores asignados serán 0 (non participa da política) e 1 (si participa da política). Na segunda columna, á que neste exemplo chamamos «Inge_2020», recolleranse todos os valores de ingresos das empresas das que se posúen datos.
3.5. Código para análise de mostras
Ver arquivo adxunto
4. Resultados e interpretación
A metodoloxía de análise estatística Propensity Score Matching (PSM), analiza as covarianzas entre dous grupos de valores: por unha parte, as empresas non participantes dunha política económica e, por outra, as participantes. De entre os diferentes métodos para levar a cabo o matching (xact matching, nearest neighbor, optimal matching, full matching and caliper matching,…), no actual exercicio seleccionouse o nearest neighbor, por consideralo máis apropiado ao realizar o matching de cada individuo do grupo de tratamento co individuo do grupo de control que ten o propensity score máis próximo.
Logo de realizar a proba estatística, obterase o número de observacións da mostra control con datos para o indicador (n1) e o número de observacións da mostra de empresas participantes da política (n2). Tanto para a mostra control como para as empresas participantes, o software R calcula o número de observacións para as que se produce matching. A continuación estudarase a media de cada un dos grupos de valores () e a súa desviación típica (). No caso de que o valor da diferenza media estandarizada (ou DME), medida a través do índice-d, resulte maior que 0,1, observaríase desequilibrio e deberíase aplicar o PSM. A continuación, o resultado ofrecerá a estimación da puntuación de propensión aplicando un modelo logit no que a variable resultado é unha variable binaria que indica a aplicación da política ou non. Unha vez finalizado o test, analízase o p-valor, que indica se existen diferenzas significativas entre o grupo que participa da política e que non, para o que se observará se é <0,05.
5. Avaliación da práctica desenvolvida
Tras un proceso de autoavaliación, o equipo multidisciplinar de docentes que deseñou a experiencia considera que a posibilidade de estender a práctica a varias sesións co alumnado enriquecería a experiencia. Isto permitiría que o alumnado puidese non só acadar o nivel de desempeño da tarefa perseguido, senón que sería quen de interiorizar a tarefa e explorar e practicar diferentes opcións de aplicabilidade do coñecemento adquirido.
Na mesma liña anterior, e en relación con posibles alternativas de aplicabilidade da análise realizada, sería interesante explotar as sinerxías que esta práctica ten con diferentes módulos de ciclos superiores de formación profesional. En concreto, obsérvanse complementariedades con módulos como o de Simulación Empresarial, do ciclo superior de Administración e Finanzas, así como cos módulos de proxecto dos ciclos das familias de Administración e Xestión, Comercio e Márketing, ou Informática e Comunicacións, principalmente.
En relación coa avaliación e información obtida do alumnado participante na experiencia, este amosa a súa satisfacción por ser quen de medir o impacto de decisións económicas e de desenvolver unha tarefa con certo nivel de complexidade que lle outorga un coñecemento específico avanzado. Ao mesmo tempo, ser quen de desenvolver esta tarefa permitiralles diferenciarse respecto doutros traballadores na súa próxima incorporación ao mercado laboral. Por outra banda, o feito de integrar as TIC na experiencia resulta ser un punto forte para a realización da práctica, adaptándose a unha contorna de crecente dixitalización da actividade laboral.
Desde o punto de vista dos docentes, considérase de grande interese que o alumnado teña instrumentos e ferramentas con aplicabilidade na contorna laboral e que permitan optimizar a planificación de medidas económicas e a medición de resultados das accións derivadas da toma de decisións. Pensamos que os coñecementos de nivel avanzado adquiridos permitirán diferenciar o alumnado no desempeño das tarefas laborais futuras.
Un aspecto que cabería considerar en relación con esta experiencia sería a posibilidade de crear un proxecto de aprendizaxe-servizo no que, coa colaboración das institucións públicas e do terceiro sector (asociacións de empresarios, comerciantes etc.), se realizasen estudos de impacto de posibles medidas económicas sectoriais.
No que respecta ás dificultades, pensamos que estas aparecerían, de ser o caso, por tratar conceptos teóricos cun certo nivel de abstracción. Non obstante, consideramos que, a pesar de que poidan xurdir dúbidas na interpretación de resultados estatísticos e no manexo do software, isto podería ser unha oportunidade para afondar na competencia matemática e dixital (tan necesarias para a inserción dos traballadores con formación de ensino superior) grazas ao acompañamento e guía no desenvolvemento da tarefa realizados polo profesorado.
Harvard Deusto Business Review & EAE Business School (2015). Definición y principales tipos de diversificación empresarial [en liña]. Obtido de EAE Business School en http://retosdirectivos.eae.es [ref. de 01 de novembro de 2015]. Dispoñible en: http://retosdirectivos.eae.es/definicion-y-principales-tipos-de-diversif...
Lundvall, B. A. (1992). National Systems of Innovation. London: Pinter.
OECD (1996). The Knowledge-based Economy. París: ref. núm. OCDE/GD(96)102.
Ramírez, M. (2012). Modelos y estrategias de enseñanza para ambientes innovadores. Monterrey, México: Editorial Digital del Tecnológico de Monterrey.
Rosenbaum, P. R., Rubin, D. B. (1983). The central role of the propensity score in observational studies for causal effects, Biometrika 70 (1), 41- 55.
Van Oort, F., & Cortinovis, N. (2015). Related Variety, Unrelated Variety and Regional Economic Growth in Europe, The Annals of Regional Science, 32, 7-32.