Programas gratuitos para análisis de datos estadísticos. Cómo trabajar en estadísticas_más

Resumen de programas estadísticos






En la etapa de planificación de un experimento, las funciones del menú Muestreo serán útiles para el investigador, permitiéndole determinar el número requerido de grupos para algunas de las tareas de investigación más comunes. Entre las funciones implementadas en MedCalc, cabe destacar la capacidad de realizar tipos básicos de análisis estadístico sin tener valores de muestra, es decir. basado en valores promedio, indicadores de dispersión, etc. Esto puede ser útil al estudiar datos de la literatura, ya que información completa Los resultados principales del experimento no se informan en publicaciones. Por ejemplo, para comparar medias muestrales mediante el test de Student, basta con conocer las medias aritméticas mismas, la desviación estándar y los tamaños de ambas muestras. Estos datos se deben ingresar en la ventana llamada Pruebas > Comparación de >


Título: Revisión de programas estadísticos
Descripción detallada:

La productividad del trabajo realizado está estrechamente relacionada con las herramientas utilizadas. Entonces, según la leyenda, Arquímedes dijo que podría voltear la Tierra si recibiera el punto de apoyo y la palanca necesarios. Pero el gran filósofo no tenía las herramientas necesarias y nuestro planeta sigue volando en su órbita. Una situación similar surge en el campo del análisis estadístico de los resultados de la investigación. Es muy posible llevar a cabo el procesamiento de datos estadísticos con sólo lápiz y papel, pero es mucho más rápido y eficiente hacerlo con la ayuda de herramientas especiales, a saber, estadísticas. software. Estrictamente hablando, los paquetes de software utilizados para el análisis estadístico deben clasificarse como programas matemáticos, por lo que en este artículo los términos "matemático" y "estadístico" se utilizarán indistintamente.

Los jóvenes científicos suelen dar sus primeros pasos en estadística utilizando procesadores de hojas de cálculo, y la gran mayoría utiliza MS Excel. El segundo procesador de hojas de cálculo más popular en la actualidad es Calc de sala de oficina OpenOffice.org. Desafortunadamente, algunos investigadores perciben estos programas como la herramienta de análisis más conveniente y adecuada. Sin embargo, se equivocan. El uso de dicho software está permitido en los casos en que sea necesario realizar operaciones simples como clasificar datos, calcular estadísticas descriptivas, construir ciertos tipos de gráficos y también simplemente guardar los datos primarios de su experimento y llevar un diario de laboratorio. En otras palabras, el procesamiento estadístico completo de los resultados de la investigación en Excel es imposible. Esta es una aplicación de oficina, no científica.

Todas las aplicaciones científicas matemáticas se pueden dividir en dos grandes grupos: programas con interfaz gráfica y sin él. No debes pensar que la interfaz gráfica de alguna manera caracteriza la calidad. producto de software. Estas propiedades no dependen en modo alguno unas de otras. Sin embargo, tal división es de gran importancia práctica. El hecho es que no todo el mundo puede trabajar cómodamente en la línea de comandos. Hoy en día, muchos usuarios de ordenadores ni siquiera piensan en abandonar los "cliquedromos" sobre los que se basa una parte impresionante de la moderna industria de TI. Sin embargo, es aún más conveniente realizar cálculos matemáticos escribiendo comandos desde el teclado en lugar de hacer clic en numerosos botones en la pantalla. Por tanto, en aplicaciones serias existe un modo. línea de comando con lenguaje de programación incorporado e interfaz gráfica.

Primero, familiaricémonos con el entorno informático estadístico y el lenguaje de programación R. Sus orígenes se encuentran en el lenguaje de programación S, con el que tienen mucho en común. El paquete estándar de R no incluye una interfaz gráfica, que resulta familiar para muchos usuarios. Como resultado, varios investigadores tienen la opinión errónea de que esta herramienta solo permite realizar cálculos numéricos, pero no tiene la capacidad de crear gráficos. Esto está mal. El sistema R tiene amplias capacidades para el procesamiento de datos estadísticos, incluido el trabajo con gráficos, y la interfaz de ventana se puede instalar como una aplicación adicional. Pero hay que tener en cuenta que las interfaces gráficas de usuario de R son notablemente inferiores a las de otros paquetes estadísticos.

Puede instalar el entorno R en una computadora que ejecute control de ventanas, MacOS o Linux. Al iniciar el sistema R, un usuario inexperto tendrá la pregunta: "¿Dónde debo ingresar los datos?" Debido a la falta de un editor de tablas incorporado, la información analizada se ingresa directamente en la línea de comando como argumento para las funciones correspondientes o se carga desde archivos externos. La primera opción es conveniente cuando se trabaja con valores únicos y la segunda, en los casos en que es necesario trabajar con tablas. Las tablas en sí se pueden crear en cualquier procesador de hojas de cálculo y los archivos se pueden guardar en formato *.csv, que se carga fácilmente en R.

Después de cargar información en variables, puede comenzar a procesarla utilizando una gran cantidad de funciones implementadas en R. Pero debe recordar que todos los datos intermedios cuando se trabaja con este lenguaje no se almacenan en archivos temporales, sino directamente en memoria de acceso aleatorio. Esta característica debe tenerse en cuenta al procesar cantidades muy grandes de información: R utilizará una parte importante de la RAM del ordenador.
La sintaxis del idioma es bastante simple y fácil de aprender. Hasta la fecha, se han escrito más de cien libros sobre diversas áreas del uso del entorno informático estadístico R, pero todos ellos se basan en idioma en Inglés. Desafortunadamente, todavía hay muy poca información en ruso y solo se presenta en forma de artículos dispersos sobre algunas cuestiones de uso. de este idioma programación. Es la falta de información lo que frena la difusión de un paquete de software de alta calidad en nuestro país (a pesar de que es gratuito).

La fiabilidad del R proviene de sus orígenes. El lenguaje fue creado como una implementación gratuita del muy poderoso lenguaje de programación S, cuya historia se remonta a 1976, cuando se creó el primer versión de trabajo. Hoy en día, el lenguaje S es la base de la aplicación S-PLUS desarrollada por TIBCO Software Inc. y, a diferencia de R, es un producto comercial. S-PLUS tiene una interfaz gráfica agradable, en la que se pueden ingresar datos cargándolos desde un archivo externo, base de datos o copiando una tabla de Archivo de texto, o un procesador de mesa. S-PLUS, al igual que R, puede ejecutarse en diferentes sistemas operativos y puede utilizarse para realizar métodos de análisis numéricos y gráficos.

Otra aplicación estadística popular es SAS, que se originó en la década de 1960 en la Universidad de Carolina del Norte como una aplicación para analizar resultados de investigaciones agrícolas. Hoy en día, el sistema continúa siendo desarrollado por el Instituto SAS, que ya lanzó la novena versión de este programa. El ámbito de aplicación de SAS es muy diverso Investigación científica, analista de negocios, etc.

El sistema consta de módulos, cada uno de los cuales realiza una gama específica de tareas. Los módulos BASE y STAT se utilizan con mayor frecuencia en el procesamiento estadístico. Implementado en el sistema SAS. lenguaje propio programación, que en su sintaxis se acerca más a BASIC y no se parece a R o S. El sistema permite cargar datos de archivos externos o ingresarlos directamente en la ventana del terminal. Trabajando con SAS se pueden realizar tratamientos estadísticos de datos de diferentes niveles de complejidad, de acuerdo con las tareas asignadas. La interacción con el programa es posible tanto en modo consola como a través de una interfaz gráfica, que es un shell gráfico para la entrada simplificada de comandos del lenguaje de programación SAS.

Los programas que utilizan principalmente una interfaz de línea de comandos también incluyen Stata, desarrollado por la corporación estadounidense StataCorp. La aplicación puede ejecutarse en sistemas operativos. familia de ventanas, en MasOS y Linux. La entrada de datos aquí es posible cargándola desde archivos externos o usando el editor de tablas incorporado, que es bastante simple, pero le permite realizar todas las manipulaciones necesarias con las tablas. Los principios para trabajar con la aplicación Stata no son diferentes de los que se utilizan cuando se utilizan los programas descritos anteriormente. Aquellos usuarios que encuentren inconveniente el modo terminal pueden usar el menú del programa para generar automáticamente comandos del lenguaje de programación integrado.
Todos los paquetes estadísticos descritos se pueden utilizar para cualquier tipo de análisis estadístico. Por lo tanto, la funcionalidad del lenguaje R se puede cambiar agregando bibliotecas de funciones que estén estrictamente orientadas cierto tipo tareas. Además, cualquiera que tenga suficiente conocimiento y experiencia con este lenguaje puede crear sus propias funciones y bibliotecas que correspondan a las características específicas de un usuario en particular.

Pero además del software estadístico de “perfil general”, existen programas dirigidos a científicos que trabajan en el campo de la investigación biomédica. Así, el programa MedCalc, desarrollado desde 1993 por la empresa belga MedCalc Software, se posiciona como una aplicación estadística completa creada de acuerdo con las necesidades de los investigadores biomédicos. Los desarrolladores centran la atención de los investigadores en la facilidad de uso de MedCalc para analizar curvas ROC.

El programa es conveniente porque no ofrece funciones redundantes, lo que a menudo confunde a una persona no preparada que comienza a trabajar con aplicaciones universales. Además de esto, la capacidad de trabajar solo en una interfaz gráfica sin usar la línea de comando hace que el programa sea menos flexible, pero más atractivo para su uso en este campo de la ciencia, ya que los especialistas con educación médica rara vez pueden presumir de una amplia experiencia trabajando con programas matemáticos.

Hasta la fecha se ha creado la duodécima versión del programa. Desafortunadamente, sólo Usuarios de Windows, pero esta desventaja se compensa con relativamente pequeños Requisitos del sistema y la capacidad de ejecutar la aplicación tanto en Windows 2000 como en Windows 7. Para aquellos que nunca han usado el programa, es posible descargar una versión de demostración completamente funcional del producto desde el sitio web medcalc.org, que funcionará sin restricciones durante quince días. Además, el paquete incluye archivos de demostración que contienen conjuntos de datos y ejemplos de su análisis.

La entrada de datos en MedCalc se realiza en el editor de tablas integrado o importando archivos de varios formatos, como *.csv, excel, etc. Para llamar al editor integrado, simplemente seleccione el comando Hoja de cálculo en el menú, después de lo cual puede comenzar a generar una tabla. En los programas estadísticos, las columnas de las tablas se denominan "variables" y las filas "casos". Al crear una tabla, será útil seguir varias reglas:
. La primera variable debe contener los números de serie de los casos. Esto es necesario para poder restaurar su orden anterior después de reordenar los valores.
. Los valores numéricos se deben ingresar sin redondear para evitar perder información.
. Si faltan algunos valores, puede omitirlos y dejar celdas vacías en la tabla.
. Cada variable debe tener un solo valor para cada caso.

Luego de guardar la tabla o cargar un archivo con datos, comienza la etapa de procesamiento de la información. Para realizar un análisis estadístico, seleccione el elemento apropiado en el menú Estadísticas. Cada tipo de análisis tiene su propio conjunto de configuraciones, para las cuales se puede obtener ayuda haciendo clic en el botón Ayuda.
En la etapa de planificación de un experimento, las funciones del menú Muestreo serán útiles para el investigador, permitiéndole determinar la cantidad requerida de grupos para algunas de las tareas de investigación más comunes. Entre las funciones implementadas en MedCalc, cabe destacar la capacidad de realizar tipos básicos de análisis estadístico sin tener valores de muestra, es decir. basado en valores promedio, indicadores de dispersión, etc. Esto puede ser útil al estudiar datos de la literatura, ya que las publicaciones no proporcionan información completa sobre los resultados primarios del experimento. Por ejemplo, para comparar medias muestrales mediante el test de Student, basta con conocer las medias aritméticas mismas, la desviación estándar y los tamaños de ambas muestras. Estos datos deben ingresarse en la ventana llamada Pruebas > Comparación de > medias (prueba t), y el resultado de la comparación se mostrará en la misma ventana. El resto de funciones del menú Pruebas se utilizan de la misma forma.

Así, el programa MedCalc, a un precio relativamente bajo, proporciona al usuario una interfaz cómoda sin "funcionalidades" innecesarias, equipada con un buen editor de hojas de cálculo. Todos los cálculos y diagramas se guardan en un archivo y se ordenan fácilmente en una lista especial en el lado izquierdo de la ventana principal del programa. El análisis estadístico se realiza mediante menús convenientemente organizados, provistos de material de referencia conciso y comprensible. En este sentido, el programa será de gran utilidad para científicos que realicen investigaciones biomédicas y para aquellos que no tengan experiencia en aplicaciones matemáticas.

MedCalcl es un programa simple y fácil de usar, pero no todos los usuarios pueden obtener todo lo que necesitan para hacer su trabajo. Entre quienes imponen exigencias muy altas al software estadístico y están dispuestos a desembolsar varios miles de dólares por él, aplicaciones como Statistica o SPSS Statistics son populares. Ambos programas son verdaderos "monstruos" en comparación con MedCalc, tanto en costo como en capacidades informáticas. Es imposible hablar de ellos en detalle en el marco de un artículo; para ello habría que escribir un libro de varios cientos de páginas, por lo que nos limitaremos a una breve introducción.

Estadística es desarrollada por StatSoft. Hasta la fecha, la última versión es Statistica 9. El programa SPSS, cuyo nombre es una abreviatura de Statistical Package for the Social Sciences, pasó hace relativamente poco tiempo a ser propiedad de IBM y cambió su nombre a PASW (Predictive Analytics SoftWare) Statistics. Ambos programas tienen una excelente interfaz gráfica, un lenguaje de programación incorporado y la capacidad de integrarse con el lenguaje de computación estadística R.

Cabe señalar que las posibilidades casi ilimitadas de procesamiento estadístico que ofrecen estas herramientas requieren grandes recursos informáticos. Por tanto, SPSS requiere al menos 1 GB de RAM para ejecutarse. SO, en el que puedes ejecutar SPSS: Windows, MacOS y Linux. Statistica está desarrollado sólo para Windows, lo que reduce un poco el número de usuarios.

Como siempre, el trabajo en programas comienza con la entrada de datos. El procesador de tablas integrado le permite crear tablas utilizando métodos familiares para todos los usuarios de aplicaciones de oficina. Las tablas guardadas, así como los resultados de los cálculos, gráficos e informes en Statistica se pueden organizar cómodamente en un archivo llamado "Libro de trabajo", mientras que la organización del espacio de trabajo en SPSS es menos conveniente, pero sigue siendo bastante aceptable para su uso después de un corto período de tiempo. adaptación.

Los programas contienen todos los métodos estadísticos más populares: análisis de frecuencia, cálculo de características estadísticas, tablas de contingencia, correlaciones, gráficos, pruebas t y un gran número de pruebas no paramétricas, análisis de regresión lineal multivariante, análisis discriminante, análisis factorial, análisis de conglomerados, análisis de varianza, análisis de confiabilidad, escalamiento multidimensional y muchos otros. La llamada a estos procedimientos estadísticos se realiza seleccionando las ventanas apropiadas del menú y realizando los ajustes necesarios en ellas. Todos los tipos de análisis se dividen en grupos, lo que le ayuda a navegar rápidamente por la interfaz de la aplicación.

Los sistemas STATISTICA y SPSS tienen amplia capacidades gráficas. Incluyen una amplia variedad de categorías y tipos de gráficos, incluidos gráficos científicos, comerciales, 3D y 2D en varios sistemas coordenadas, gráficos estadísticos especializados: histogramas, matrices, gráficos categorizados, etc.

Las funciones estadísticas disponibles en ambas aplicaciones llaman la atención por su variedad. Parece que estas herramientas de análisis estadístico permiten hacer cualquier cosa, siempre que el usuario haya estudiado a fondo cómo funcionan. El principal obstáculo para dominar estos programas es el tiempo que se necesita dedicar a la formación. Precisamente por el desconocimiento del usuario, en la mayoría de los casos la potencia de los paquetes estadísticos de este nivel no se aprovecha ni la mitad.

Como puede ver, existen muchas aplicaciones para el análisis estadístico en el mundo. En este artículo sólo se describe brevemente una pequeña parte de ellos. Fuera de él, existían programas como Minitab, MatLab, Octave, GenStat, JMP, Analyse-it, desarrollo nacional STADIA y muchos otros, grandes y pequeños, caros y programas gratis. Sin embargo, tal abundancia de software no debería asustar al investigador; bastará con que una vez haga una elección reflexiva a favor de uno o dos programas, estudie cuidadosamente las complejidades de su uso y le servirán como fieles asistentes en el análisis estadístico. de resultados experimentales durante muchos años.



ESTADÍSTICA es un sistema para el análisis de datos estadísticos, que incluye una amplia gama de procedimientos y métodos analíticos:
Mas que 100 varios tipos gráficos, estadísticas descriptivas y dentro del grupo, análisis exploratorio de datos, correlaciones, estadísticas rápidas básicas y de bloques, calculadora de probabilidad interactiva, pruebas T (y otras pruebas de diferencias de grupo), frecuencia, contingencia, tablas de banderas y encabezados, análisis de respuesta multivariado, múltiples regresión, estadística no paramétrica, modelo general de análisis de varianza y covarianza, ajuste de distribuciones, minería de datos, Redes neuronales y mucho más. Los productos de la serie STATISTICA se basan en los más tecnologías modernas, cumplen plenamente con los últimos avances en el campo de TI, le permiten resolver cualquier problema en el campo del análisis y procesamiento de datos, ideal para resolver problemas prácticos en marketing, finanzas, seguros, economía, negocios, industria, medicina, etc.

Comsol Multifísica 4.3
Un programa para cálculos de elementos finitos de problemas científicos y técnicos complejos. COMSOL Multiphysics le permite simular casi todos los procesos físicos que se describen mediante ecuaciones diferenciales parciales. El programa contiene varios solucionadores que le ayudarán a afrontar rápidamente incluso los problemas más complejos, y la estructura simple de la aplicación garantiza facilidad de uso y flexibilidad. La solución a cualquier problema se basa en la solución numérica de ecuaciones diferenciales parciales mediante el método de los elementos finitos. La gama de tareas que se pueden modelar en el programa es extremadamente amplia.

Equipo módulos especiales El programa cubre casi todas las áreas de aplicación de ecuaciones diferenciales parciales.
COMSOL Multiphysics (Femlab) es un paquete de simulación que resuelve sistemas de ecuaciones diferenciales parciales no lineales utilizando métodos de elementos finitos en una, dos y tres dimensiones. Le permite resolver problemas en el campo del electromagnetismo, teoría de la elasticidad, dinámica de líquidos y gases y dinámica química de gases. Femlab también permite resolver el problema tanto en una formulación matemática (en forma de sistema de ecuaciones) como física (eligiendo un modelo físico, por ejemplo, un modelo del proceso de difusión). Por supuesto, en cualquier caso, se resolverá un sistema de ecuaciones, y la diferencia radica únicamente en la capacidad de utilizar sistemas físicos de unidades y terminología física. En el llamado modo de operación físico, también es posible utilizar ecuaciones predefinidas para la mayoría de los fenómenos que se encuentran en la ciencia y la tecnología, como la transferencia de calor y electricidad, la teoría de la elasticidad, la difusión, la propagación de ondas y el flujo de fluidos.

ESTADÍSTICA
Año/Fecha de emisión: 2011
Versión: 10.0.1011
Capacidad de bits: 32 bits
Compatibilidad de Vista: lleno
Compatibilidad con Windows 7: lleno
Lenguaje de interfaz: Inglés
Tableta: Presente

Comsol Multifísica 4.3
Año/Fecha de emisión: 2012
Versión: 4.3 compilación 151 (compilación 184 si instala Update1)
Profundidad de bits: 32 bits y 64 bits
Compatible con Vista y Windows 7: lleno
Lenguaje de interfaz: Inglés
Tableta: Presente
Tamaño de construcción: 5,18GB

Cómo solucionar problemas:
1. Si hay un problema con la licencia (durante la instalación o el inicio) y está trabajando a través de un escritorio remoto, intente usar Radmin.
2. Si no se muestra nada en la ventana principal, intente cambiar Opciones -> Preferencias -> Gráficos -> Representación a otra cosa (el valor predeterminado es OpenGL, es decir, normalmente necesita cambiar a DirectX... también puede hacerlo a Software, pero es Más lento).

Además de los paquetes estadísticos comerciales, existe una gran cantidad de programas y aplicaciones estadísticas completamente gratuitos. Al mismo tiempo, una serie de programas gratuitos no sólo no son inferiores, sino incluso superiores en funcionalidad a las aplicaciones comerciales. Daré una lista de los principales programas gratuitos para el procesamiento de datos estadísticos.

ξ EpiInfo - un paquete estadístico gratuito respaldado por los Centros para el Control de Enfermedades de EE. UU. La característica principal es la capacidad no sólo de realizar análisis estadísticos, sino también de crear cuestionarios y formularios para la entrada de datos (incluida la creación de formularios para recopilar información en Internet). Ultima versión También admite integración con Google Maps y visualización de información cartográfica. Una limitación bastante importante para grandes conjuntos de datos puede ser el uso del formato Microsoft Access como base de datos.

ξ AbrirEpi— un conjunto de funciones estadísticas que le permite aplicar rápidamente pruebas estadísticas relativamente simples y de uso frecuente. OpenEpi se puede utilizar en línea en el sitio web del desarrollador o instalarse en su computadora. La ventaja del paquete es un conjunto de funciones para calcular el poder estadístico, el número de grupos, la generación. números al azar, así como la capacidad de calcular la significación estadística basándose en estadísticas de grupo, lo que puede resultar útil a la hora de evaluar artículos.

ξPSPP- Por apariencia y la funcionalidad recuerda mucho a SPSS (de hecho, el nombre del paquete es una imagen reflejada) y es completamente gratuito.

ξ SOFÁ — Le permite realizar pruebas estadísticas básicas, pero no le permite realizar análisis de regresión. Uno de características distintivas el paquete es creación rápida varios gráficos estándar y tablas de resumen que no requieren formato, así como la capacidad de ejecutar scripts personalizados en Python.

ξSEER-Stat es un paquete estadístico gratuito destinado a su aplicación en oncología, cuyo desarrollo cuenta con el apoyo del Instituto del Cáncer de EE. UU. El paquete de software tiene muchas funciones para calcular la morbilidad, la supervivencia y la mortalidad (incluidos indicadores estandarizados por edad).

ξWINPEPI— un programa de análisis de datos epidemiológicos. Descripción detallada se ubica la funcionalidad. El mismo autor creó varios otros programas para su uso en epidemiología.

ξ Análisis estadístico para epidemiología genética es un programa de análisis estadístico para genetistas y epidemiólogos que contiene muchas funciones para obtener estadísticas descriptivas, verificar datos, cuantificar la heredabilidad de un rasgo o enfermedad, estimar la edad más probable de aparición de una enfermedad, identificar patrones en la aparición de alelos individuales o cambios de un solo nucleótido y otras capacidades.



gastrogurú 2017