Gu.a Del Usuario De IBM SPSS Statistics 23 Core System IBM_SPSS_Statistics_Core_System_User_Guide User Guide

User Manual: IBM_SPSS_Statistics_Core_System_User_Guide user guide pdf - FTP File Search (15/20)

Open the PDF directly: View PDF PDF.
Page Count: 316 [warning: Documents this large are best viewed by clicking the View PDF Link!]

Guía del usuario de IBM SPSS
Statistics 23 Core System

Nota
Antes de utilizar esta información y el producto al que da soporte, lea la información de “Avisos” en la página 295.
Información del producto
Esta edición se aplica a la versión 23, release 0, modificación 0 de IBM SPSS Statistics y a todos los releases y
modificaciones posteriores hasta que se indique lo contrario en nuevas ediciones.
Contenido
Capítulo 1. Conceptos básicos .....1
Windows ...............1
Ventana designada frente a ventana activa . . . 1
Barra de estado .............2
Cuadros de diálogo ............2
Nombres y etiquetas de variable en las listas de los
cuadros de diálogo ............2
Cuadro de diálogo con tamaño ajustado .....3
Controles del cuadro de diálogo ........3
Seleccionar variables............3
Iconos de tipo de datos, nivel de medición y lista de
variables................4
Información sobre las variables en un cuadro de
diálogo ................4
Pasos básicos en el análisis de datos ......4
Asesor estadístico.............4
Información adicional ...........5
Capítulo 2. Obtención de ayuda ....7
Obtención de ayuda sobre los términos de los
resultados ...............8
Capítulo 3. Archivos de datos .....9
Apertura de archivos de datos ........9
Para abrir archivos de datos ........9
Tipos de archivos de datos ........10
Opciones de apertura de archivos ......10
Lectura de archivos de Excel .......10
Lectura de archivos de Excel y otras hojas de
cálculo de versiones anteriores .......11
Lectura de archivos de dBASE .......11
Lectura de archivos de Stata ........11
Lectura de archivos de bases de datos ....12
Asistente para texto ..........18
Lectura de datos de Cognos BI .......22
Lectura de datos de Cognos TM1 ......24
Lectura de datos de IBM SPSS Data Collection . 25
Información sobre el archivo.........27
Almacenamiento de archivos de datos .....28
Para guardar archivos de datos modificados . . 28
Guardar archivos de datos en la codificación de
caracteres de la página de códigos......28
Almacenamiento de archivos de datos en
formatos externos ...........28
Almacenamiento de archivos de datos en formato
de Excel ..............31
Almacenamiento de archivos de datos en formato
SAS................32
Almacenamiento de archivos de datos en formato
Stata................33
Almacenamiento de subconjuntos de variables . 34
Cifrado de archivos de datos .......34
Exportación a base de datos ........35
Exportación a IBM SPSS Data Collection....41
Exportación a Cognos TM1 ........42
Comparación de conjuntos de datos ......44
Comparar conjuntos de datos: pestaña Comparar 44
Comparar conjuntos de datos: pestaña Atributos 45
Comparación de conjuntos de datos: pestaña
Resultados..............45
Protección de datos originales ........46
Archivo activo virtual ...........46
Creación de una caché de datos ......47
Capítulo 4. Análisis en modo
distribuido .............49
Acceso al servidor ............49
Adición y edición de la configuración de acceso
al servidor..............50
Para seleccionar, cambiar o añadir servidores . . 50
Búsqueda de servidores disponibles .....51
Apertura de archivos de datos desde un servidor
remoto ................51
Acceso a archivo en análisis en modo local y
distribuido ..............51
Disponibilidad de procedimientos en análisis en
modo distribuido ............52
Especificaciones de rutas absolutas frente a rutas
relativas ...............52
Capítulo 5. Editor de datos ......55
Vista de datos .............55
Vista de variables ............55
Para visualizar o definir los atributos de las
variables ..............56
Nombres de variable ..........56
Nivel de medición de variable .......57
Tipo de variable ............58
Etiquetas de variable ..........59
Etiquetas de valores ..........59
Inserción de saltos de línea en etiquetas ....60
Valores perdidos............60
Papeles ...............60
Ancho de columna ...........61
Alineación de la variable .........61
Aplicación de atributos de definición de variables
a varias variables ...........61
Atributos personalizados de variables ....62
Personalización de la Vista de variables ....64
Revisión ortográfica ..........64
Introducción de datos ...........65
Para introducir datos numéricos ......65
Para introducir datos no numéricos .....65
Para utilizar etiquetas de valor en la introducción
de datos ..............66
Restricciones de los valores de datos en el Editor
de datos ..............66
edición de datos .............66
Para reemplazar o modificar un valor de datos 66
Cortar, copiar y pegar valores de datos ....66
iii
Inserción de nuevos casos ........67
Inserción de nuevas variables .......67
Para cambiar el tipo de datos .......68
Búsqueda de casos, variables o imputaciones . . . 68
Búsqueda y sustitución de datos y valores de
atributo................69
Obtención de estadísticos descriptivos para variables
seleccionadas ..............69
Estado de selección de casos en el Editor de datos 70
Editor de datos: Opciones de presentación ....70
Impresión en el Editor de datos .......71
Para imprimir los contenidos del Editor de datos 71
Capítulo 6. Trabajo con varios orígenes
de datos ..............73
Tratamiento básico de varios orígenes de datos . . 73
Trabajo con varios conjuntos de datos en la sintaxis
de comandos ..............73
Copia y pegado de información entre conjuntos de
datos ................73
Cambio del nombre de los conjuntos de datos . . . 74
Supresión de varios conjuntos de datos .....74
Capítulo 7. Preparación de los datos 75
Propiedades de variables ..........75
Definición de propiedades de variables .....75
Para definir propiedades de variables.....76
Definición de etiquetas de valor y otras
propiedades de las variables........76
Asignación del nivel de medición ......78
Atributos personalizados de variables ....78
Copia de propiedades de variables .....78
Definición del nivel de medición para variables con
un nivel de medición desconocido.......79
Conjuntos de respuestas múltiples.......79
Para definir conjuntos de respuestas múltiples. . 80
Copiar propiedades de datos ........81
Copia de propiedades de datos .......81
Identificación de casos duplicados .......85
Agrupación visual ............86
Para agrupar variables..........87
Agrupación de variables .........87
Generación automática de categorías agrupadas 89
Copia de categorías agrupadas .......90
Valores perdidos del usuario en la agrupación
visual ...............90
Capítulo 8. Transformaciones de los
datos ...............93
Transformaciones de los datos ........93
Cálculo de variables ...........93
Calcular variable: Si los casos .......93
Calcular variable: Tipo y etiqueta ......94
Funciones ...............94
Valores perdidos en funciones ........94
Generadores de números aleatorios ......95
Contar apariciones de valores dentro de los casos . 95
Contar valores dentro de los casos: Valores a
contar ...............95
Contar apariciones: Si los casos.......96
Valores de cambio ............96
Recodificación de valores ..........97
Recodificar en las mismas variables ......97
Recodificar en las mismas variables: Valores
antiguos y nuevos ...........97
Recodificar en distintas variables .......98
Recodificar en distintas variables: Valores
antiguos y nuevos ...........98
Recodificación automática .........99
Casos de rangos ............101
Asignar rangos a los casos: Tipos......101
Asignar rangos a los casos: Empates.....102
Asistente de fecha y hora .........102
Fechas y horas en IBM SPSS Statistics ....103
Creación de una variable de fecha/hora a partir
de una cadena ............104
Creación de una variable de fecha/hora a partir
de un conjunto de variables .......104
Adición o sustracción de valores a partir de
variables de fecha/hora .........105
Extracción de parte de una variable de
fecha/hora .............107
Transformaciones de los datos de serie temporal 107
Definir fechas ............108
Crear serie temporal ..........108
Reemplazar los valores perdidos ......110
Capítulo 9. Gestión y transformación
de los archivos ..........113
Gestión y transformación de los archivos ....113
Ordenar casos .............113
Ordenar variables ............114
Transponer ..............115
Fusión de archivos de datos ........115
Añadir casos ............115
Añadir variables ...........117
Agregar datos .............118
Agregar datos: Función de agregación ....120
Agregar datos: Nombre y etiqueta de variable 120
Segmentar archivo............120
Seleccionar casos ............121
Seleccionar casos: si ..........122
Seleccionar casos: muestra aleatoria .....122
Seleccionar casos: rango .........122
ponderación de casos...........122
Reestructuración de los datos ........123
Para reestructurar datos .........123
Asistente de reestructuración de datos:
seleccionar tipo............123
Asistente de reestructuración de datos (variables
a casos): número de grupos de variables . . . 126
Asistente de reestructuración de datos (variables
a casos): seleccionar variables .......127
Asistente de reestructuración de datos (variables
a casos): crear variables de índice......128
Asistente de reestructuración de datos (variables
a casos): crear una variable de índice ....129
Asistente de reestructuración de datos (variables
a casos): crear varias variables de índice . . . 129
Asistente de reestructuración de datos (variables
a casos): opciones ...........130
iv Guía del usuario de IBM SPSS Statistics 23 Core System
Asistente de reestructuración de datos (casos a
variables): seleccionar variables ......130
Asistente de reestructuración de datos (casos a
variables): ordenar datos ........131
Asistente de reestructuración de datos (casos a
variables): opciones ..........131
Asistente de reestructuración de datos: finalizar 132
Capítulo 10. Trabajo con resultados 133
Trabajo con resultados ..........133
Visor ................133
Mostrar y ocultar resultados .......133
Desplazamiento, eliminación y copia de
resultados .............133
Cambio de la alineación inicial ......134
Cambio de la alineación de los elementos de
resultados .............134
Titulares del visor ...........134
Adición de elementos al Visor .......135
Búsqueda y sustitución de información en el
Visor ...............136
Cierre de elementos de resultado ......137
Pegado de resultados en otras aplicaciones . . . 137
Resultado interactivo ...........138
Exportación de resultados .........139
Opciones de HTML ..........140
Opciones de informes web ........141
Opciones de Word/RTF .........142
Opciones de Excel ...........142
Opciones de PowerPoint ........143
Opciones de PDF ...........144
Opciones del texto...........144
Opciones sólo para gráficos .......145
Opciones de formato de gráficos ......145
Impresión de documentos del Visor ......146
Para imprimir resultados y gráficos .....146
Vista previa de impresión ........147
Atributos de página: encabezados y pies . . . 147
Atributos de página: opciones .......147
Almacenamiento de resultados .......148
Para guardar un documento del Visor ....148
Capítulo 11. Tablas dinámicas ....151
Tablas dinámicas ............151
Manipulación de una tabla dinámica .....151
Activación de una tabla dinámica .....151
Pivote de una tabla ..........151
Cambio del orden de visualización de elementos
dentro de una dimensión ........151
Desplazamiento de filas y columnas dentro de
un elemento de una dimensión ......152
Transposición de filas y columnas .....152
Agrupación de filas y columnas ......152
Desagrupación de filas y columnas .....152
Rotación de etiquetas de fila y columna . . . 152
Ordenación de filas ..........152
Inserción de filas y columnas .......153
Control de la visualización de la variable y
etiquetas de valor ...........153
Cambio del idioma de resultados......154
Desplazamiento por tablas grandes .....154
Deshacer cambios ...........154
Trabajo con capas ............155
Creación y visualización de capas .....155
Ir a la categoría de capa .........155
Visualización y ocultación de elementos ....155
Ocultación de filas y columnas en una tabla . . 155
Visualización de filas y columnas ocultas en una
tabla ...............155
Ocultación y visualización de etiquetas de
dimensión .............155
Ocultación y visualización de títulos de tabla 155
TableLook ..............156
Para aplicar un TableLook ........156
Para editar o crear un TableLook ......156
Propiedades de tabla ...........156
Para cambiar las propiedades de la tabla de
pivote:...............157
Propiedades de tabla: general .......157
Propiedades de tabla: notas........158
Propiedades de tabla: formatos de casilla . . . 158
Propiedades de tabla: bordes .......159
Propiedades de tabla: impresión ......159
Propiedades de casilla ..........159
Fuente y fondo ............160
Valor de formato ...........160
Alineación y márgenes .........160
Notas al pie y pies ...........160
Adición de notas al pie y pies .......160
Ocultación o visualización de un pie ....160
Ocultación o visualización de una nota al pie en
una tabla ..............160
Marcador de notas al pie ........161
Nueva numeración de notas al pie .....161
Edición de notas al pie en tablas de versiones
anteriores..............161
Anchos de casillas de datos ........162
Cambio de ancho de columna ........162
Visualización de bordes ocultos en una tabla
dinámica ...............162
Selección de filas, columnas y casillas en una tabla
dinámica ...............163
Impresión de tablas dinámicas........163
Control de saltos de tabla en tablas anchas y
largas...............163
Creación de un gráfico a partir de una tabla
dinámica ...............164
Tablas de versiones anteriores ........164
Capítulo 12. Modelos ........165
Interacción con un modelo .........165
Trabajo con el Visor de modelos ......165
Impresión de un modelo .........166
Exportación de un modelo .........167
Guardado de campos usados en el modelo en un
nuevo conjunto de datos .........167
Guardado de predictores en un nuevo conjunto de
datos según la importancia .........167
Visor de conjuntos............168
Modelos de conjuntos .........168
Segmentar Visor de modelos ........170
Contenido v
Capítulo 13. Modificación
automatizada de los resultados . . . 171
Resultado de estilo: Seleccionar .......171
Resultado de estilo ...........172
Resultado de estilo: Etiquetas y texto ....174
Resultado de estilo: Indexado .......175
Resultado de estilo: Aspectos de tabla ....175
Resultado de estilo: Tamaño .......175
Estilo de tabla .............175
Estilo de tabla: Condición ........176
Estilo de tabla: Formato .........177
Capítulo 14. Trabajar con sintaxis de
comandos.............179
Reglas de la sintaxis ...........179
Pegar sintaxis desde cuadros de diálogo ....180
Para pegar sintaxis desde cuadros de diálogo 180
Copia de la sintaxis desde las anotaciones de los
resultados ..............181
Para copiar la sintaxis desde las anotaciones de
los resultados ............181
Uso del editor de sintaxis .........181
Ventana del editor de sintaxis .......182
Terminología ............183
Autocompletar ............183
Codificación de color ..........184
Puntos de corte............185
Señalizadores ............186
Aplicación o eliminación de comentarios a texto 186
Aplicación de formato a la sintaxis .....187
Ejecución de sintaxis de comandos .....188
Codificación del juego de caracteres en archivos
de sintaxis .............189
Varios comandos Ejecutar ........189
Codificación del juego de caracteres en archivos de
sintaxis ...............190
Varios comandos Ejecutar .........191
Cifrado de archivos de sintaxis .......191
Capítulo 15. Conceptos básicos de la
utilidad de gráficos .........193
Creación y modificación de gráficos ......193
Generación de gráficos .........193
Edición de gráficos ..........194
Opciones de definición de gráfico ......195
Adición y edición de títulos y notas al pie. . . 195
Para establecer las opciones generales ....196
Capítulo 16. Puntuación de datos con
modelos predictivos ........199
Asistente para puntuación .........199
Comparación de campos de modelo con los del
conjunto de datos ...........200
Selección de funciones de puntuación ....202
Puntuación del conjunto de datos activo . . . 203
Fusión de archivos XML de transformación y de
modelo ...............203
Capítulo 17. Utilidades .......205
Utilidades ..............205
Información sobre la variable ........205
Comentarios de archivos de datos ......205
Conjuntos de variables ..........206
Definición de conjuntos de variables......206
Uso de conjuntos de variables para mostrar y
ocultar variables ............206
Reordenación de listas de variables de destino . . 207
Paquetes de extensión ..........207
Creación y edición de paquetes de extensión 207
Instalación de paquetes de extensión locales . . 211
Visualización de los paquetes de extensión
instalados .............213
Modificación de paquetes de extensiones . . . 214
Capítulo 18. Opciones........217
Opciones ...............217
Opciones generales ...........217
Opciones del Visor ...........218
Datos: Opciones ............219
Cambio de la Vista de variables predeterminado 221
Opciones de idioma ...........221
Opciones de moneda ...........222
Para crear formatos de moneda personalizados 222
Opciones de resultados ..........222
Opciones de gráfico ...........223
Colores de los elementos de datos .....223
Líneas de los elementos de datos ......224
Marcadores de los elementos de datos ....224
Rellenos de los elementos de datos .....225
Opciones de tabla dinámica ........225
Opciones de ubicaciones de archivos .....227
Opciones de scripts ...........228
Opciones del editor de sintaxis .......229
Opciones de imputación múltiple.......230
Capítulo 19. Personalización de
menús y barras de herramientas . . . 231
Personalización de menús y barras de herramientas 231
Editor de menús ............231
Personalización de las barras de herramientas . . 231
Mostrar barras de herramientas .......231
Para personalizar las barras de herramientas . . . 232
Propiedades de la barra de herramientas . . . 232
Barra de herramientas de edición......232
Crear nueva herramienta ........233
Capítulo 20. Creación y gestión de
diálogos personalizados ......235
Diseño del generador de cuadros de diálogo
personalizados .............236
Generación de un diálogo personalizado ....236
Propiedades de cuadro de diálogo ......236
Especificación de la ubicación de menú para un
cuadro de diálogo personalizado .......237
Diseño de controles en el lienzo .......238
Generación de la plantilla de sintaxis .....238
Vista previa de un diálogo personalizado ....241
Gestión de diálogos personalizados ......241
vi Guía del usuario de IBM SPSS Statistics 23 Core System
Tipos de controles ............243
Lista de origen ............244
Lista de destino ...........244
Filtrado de listas de variables .......245
Casilla de verificación .........245
Controles de cuadro combinado y cuadro de
lista ...............246
Control de texto ...........247
Control de número ..........248
Control de texto estático.........249
Grupo de elementos ..........249
Grupo de selección ..........250
Grupo de casillas de verificación ......251
Explorador de archivos .........252
Botón de sub-cuadro de diálogo ......253
Cuadros de diálogo personalizados para comandos
de extensión..............254
Creación de versiones localizadas de diálogos
personalizados .............254
Capítulo 21. Trabajos de producción 257
Archivos de sintaxis ...........258
Resultados ..............258
Opciones de HTML ..........259
Opciones de PowerPoint ........260
Opciones de PDF ...........260
Opciones de texto ...........260
Trabajos de producción con comandos OUTPUT 260
Valores en tiempo de ejecución .......261
Ejecutar opciones ............261
Acceso al servidor............262
Adición y edición de la configuración de acceso
al servidor .............262
Entradas del usuario ...........263
Estado del trabajo en segundo plano .....263
Ejecución de trabajos de producción desde una
línea de comandos ...........263
Conversión de los archivos de la unidad de
producción ..............264
Capítulo 22. Sistema de gestión de
resultados.............267
Tipos de objetos de resultados........269
Identificadores de comandos y subtipos de tabla 269
Etiquetas ...............270
Opciones de SGR ............271
Registro ...............273
Exclusión de presentación de resultados del Visor 273
Envío de resultados a archivos de datos IBM SPSS
Statistics ...............274
Archivos de datos creados a partir de varias
tablas ...............274
Control de elementos de columna para las
variables de control del archivo de datos . . . 274
Nombres de variable en los archivos de datos
generados por SGR ..........275
Estructura de tablas OXML.........275
Identificadores de SGR ..........278
Copia de identificadores SGR desde los titulares
del Visor ..............278
Capítulo 23. Utilidad de scripts ....281
Autoscripts ..............282
Creación de autoscripts .........282
Asociación de scripts existentes a objetos del
visor ...............283
Creación de scripts en lenguaje de programación
Python ...............283
Ejecución de scripts de Python y programas de
Python ..............284
Editor de scripts del lenguaje de programación
Python ..............285
Scripts en Basic.............285
Compatibilidad con versiones anteriores a 16.0 286
El objeto scriptContext .........288
Scripts de inicio ............289
Capítulo 24. Convertidor de sintaxis
de los comandos TABLES e IGRAPH . 291
Capítulo 25. Cifrado de archivos de
datos, documentos de resultados y
archivos de sintaxis ........293
Avisos ..............295
Marcas comerciales ...........297
Índice...............299
Contenido vii
viii Guía del usuario de IBM SPSS Statistics 23 Core System
Capítulo 1. Conceptos básicos
Windows
Existen diversos tipos de ventanas en IBM®SPSS Statistics:
Editor de datos. El Editor de datos muestra el contenido del archivo de datos. Puede crear nuevos
archivos de datos o modificar los existentes con el Editor de datos. Si tiene más de un archivo de datos
abierto, habrá una ventana Editor de datos independiente para cada archivo.
Visor. Todas las tablas, los gráficos y los resultados estadísticos se muestran en el Visor. Puede editar los
resultados y guardarlos para utilizarlos posteriormente. La ventana del Visor se abre automáticamente la
primera vez que se ejecuta un procedimiento que genera resultados.
Editor de tablas dinámicas. Con el Editor de tablas dinámicas es posible modificar los resultados
mostrados en este tipo de tablas de diversas maneras. Puede editar el texto, intercambiar los datos de las
filas y las columnas, añadir colores, crear tablas multidimensionales y ocultar y mostrar los resultados de
manera selectiva.
Editor de gráficos. Puede modificar los gráficos y diagramas de alta resolución en las ventanas de los
gráficos. Es posible cambiar los colores, seleccionar diferentes tipos de fuentes y tamaños, intercambiar
los ejes horizontal y vertical, rotar diagramas de dispersión 3-D e incluso cambiar el tipo de gráfico.
Editor de resultados de texto. Los resultados de texto que no aparecen en las tablas dinámicas pueden
modificarse con el Editor de resultados de texto. Puede editar los resultados y cambiar las características
de las fuentes (tipo, estilo, color y tamaño).
Editor de sintaxis. Puede pegar las selecciones del cuadro de diálogo en una ventana de sintaxis, donde
aparecerán en forma de sintaxis de comandos. A continuación puede editar esta sintaxis de comandos
para utilizar las características especiales que no se encuentran disponibles en los cuadros de diálogo.
También puede guardar los comandos en un archivo para utilizarlos en sesiones posteriores.
Ventana designada frente a ventana activa
Si tiene abiertas varias ventanas del Visor, los resultados se dirigirán hacia la ventana designada del
Visor. Si tiene abierta más de una ventana del Editor de sintaxis, la sintaxis de comandos se pegará en la
ventana designada del Editor de sintaxis. Las ventanas designadas se indican con un signo más en el
icono de la barra de título y es posible cambiarlas en cualquier momento.
La ventana designada no debe confundirse con la ventana activa, que es la ventana actualmente
seleccionada. Si tiene ventanas superpuestas, la ventana activa es la que aparece en primer plano. Si abre
una ventana, esa ventana se convertirá automáticamente en la ventana activa y en la ventana designada.
Cambio de la ventana designada
1. Convierta la ventana que desee designar en la ventana activa (pulse en cualquier punto de la
ventana).
2. Pulse en el botón Designar ventana de la barra de herramientas (la que tiene el icono del signo más).
o
3. Elija en los menús:
Utilidades >Designar ventana
© Copyright IBM Corp. 1989, 2014 1
Nota: en cuanto a las ventanas Editor de datos, la ventana Editor de datos activa determina el conjunto de
datos que se utiliza en análisis o cálculos posteriores. No hay ninguna ventana Editor de datos
"designada". Consulte el tema “Tratamiento básico de varios orígenes de datos” en la página 73 para
obtener más información.
Barra de estado
La barra de estado que aparece en la parte inferior de cada ventana de IBM SPSS Statistics proporciona la
siguiente información:
Estado del comando. En cada procedimiento o comando que se ejecuta, un recuento de casos indica el
número de casos procesados hasta el momento. En los procedimientos estadísticos que requieren
procesamientos iterativos, se muestra el número de iteraciones.
Estado del filtro. Si ha seleccionado una muestra aleatoria o un subconjunto de casos para el análisis, el
mensaje Filtrado indica que existe algún tipo de filtrado activado actualmente y por tanto en el análisis
no se incluyen todos los casos del archivo de datos.
Estado de ponderación. El mensaje Ponderado indica que se está utilizando una variable de ponderación
para ponderar los casos para el análisis.
Estado de Segmentar archivo. El mensaje Segmentar archivo activado indica que el archivo de datos se
ha segmentado en diferentes grupos para su análisis en función de los valores de una o más variables de
agrupación.
Cuadros de diálogo
La mayoría de las opciones de los menús acceden a un cuadro de diálogo cuando se seleccionan. Los
cuadros de diálogo se utilizan para seleccionar variables y opciones para el análisis.
Los cuadros de diálogo para los procedimientos estadísticos tienen normalmente dos componentes
básicos:
Lista de variables de origen. Una lista de variables en el conjunto de datos activo. En la lista de origen
sólo aparecen los tipos de variables que el procedimiento seleccionado permite. La utilización de
variables de cadena corta y de cadena larga está restringida en muchos procedimientos.
Listas de variables de destino. Una o varias listas que indican las variables elegidas para el análisis; un
ejemplo son las listas de variables dependientes e independientes.
Nombres y etiquetas de variable en las listas de los cuadros de
diálogo
Puede mostrar tanto nombres como etiquetas de variable en las listas de los cuadros de diálogo y puede
controlar el orden en el que aparecen las variables en las listas de variables de origen. Para controlar los
atributos de presentación predeterminados de las variables en las listas de origen, elija Opciones en el
menú Editar. Consulte el tema “Opciones generales” en la página 217 para obtener más información.
También puede cambiar los atributos de visualización de la lista de variables en los cuadros de diálogo.
El método para cambiar los atributos de visualización depende del cuadro de diálogo:
vSi el cuadro de diálogo proporciona controles de clasificación y visualización en la lista de variables de
origen, utilícelos para cambiar los atributos de visualización.
vSi el cuadro de diálogo no contiene controles de clasificación de la lista de variables, pulse con el botón
derecho en cualquier variable de la lista de origen y seleccione los atributos de visualización del menú
emergente.
2Guía del usuario de IBM SPSS Statistics 23 Core System
Puede mostrar los nombres o las etiquetas de variable (los nombres se muestran para cualquier variable
sin etiquetas definidas) y puede ordenar la lista de origen por orden de archivo, orden alfabético o nivel
de medición. (En cuadros de diálogo con controles de clasificación de la lista de variables de origen, la
selección predefinida de Ninguna clasifica la lista por orden de archivos.)
Cuadro de diálogo con tamaño ajustado
Puede ajustar el tamaño de los cuadros de diálogo como si fueran ventanas, pulsando y arrastrando los
bordes o esquinas exteriores. Por ejemplo, si aumenta el ancho del cuadro de diálogo, las listas de
variables también serán más anchas.
Controles del cuadro de diálogo
Existen cinco controles estándares en la mayoría de los cuadros de diálogo:
Aceptar oEjecutar. Ejecuta el procedimiento. Después de seleccionar las variables y elegir las
especificaciones adicionales, pulse en Aceptar para ejecutar el procedimiento y cerrar el cuadro de
diálogo. Algunos cuadros de diálogo tienen un botón Ejecutar en lugar del botón Aceptar.
Pegar. Genera la sintaxis de comandos a partir de las selecciones del cuadro de diálogo y la pega en la
ventana de sintaxis. A continuación, puede personalizar los comandos con características adicionales que
no se encuentran disponibles en los cuadros de diálogo.
Restablecer. Desactiva las variables en las listas de variables seleccionadas y restablece todas las
especificaciones del cuadro de diálogo y los subcuadros de diálogo al estado predeterminado.
Cancelar. Cancela los cambios que se realizaron en las selecciones del cuadro de diálogo desde la última
vez que se abrió y lo cierra. Durante una sesión se mantienen las selecciones del cuadro de diálogo. El
cuadro de diálogo retiene el último conjunto de especificaciones hasta que se anulan.
Ayuda. Proporciona ayuda contextual. Este control le lleva a una ventana de Ayuda con información
sobre el cuadro de diálogo actual.
Seleccionar variables
Para seleccionar una única variable, simplemente selecciónela en la lista de variables de origen y
arrástrela y colóquela en la lista de variables de destino. También puede utilizar el botón de dirección
para mover las variables de la lista de origen a las listas de destino. Si sólo existe una lista de variables
de destino, puede pulsar dos veces en las variables individuales para desplazarlas desde la lista de origen
hasta la de destino.
También pueden seleccionar diversas variables:
vPara seleccionar varias variables que estén agrupadas en la lista de variables, pulse en la primera de
ellas y, a continuación, en la última del grupo mientras mantiene pulsada la tecla Mayús.
vPara seleccionar varias variables que no estén agrupadas en la lista de variables, pulse en la primera de
ellas; a continuación, pulse en la siguiente variable mientras mantiene pulsada la tecla Ctrl, y así
sucesivamente (en Macintosh, pulse mientras mantiene pulsada la tecla Comando).
Capítulo 1. Conceptos básicos 3
Iconos de tipo de datos, nivel de medición y lista de variables
Los iconos que se muestran junto a las variables en las listas de los cuadros de diálogo proporcionan
información acerca del tipo de variable y el nivel de medicións.
Tabla 1. Iconos de nivel de medición
Numérico Cadena Fecha Hora
Escala (Continuo) n/a
Ordinal
Nominal
vPara obtener más información sobre el nivel de medición, consulte “Nivel de medición de variable” en
la página 57.
vPara obtener más información sobre los tipos de datos numérico, cadena, fecha y hora, consulte “Tipo
de variable” en la página 58.
Información sobre las variables en un cuadro de diálogo
La mayoría de los cuadros de diálogo permiten conocer mejor las variables que se muestran en la lista de
variables.
1. Pulse con el botón derecho del ratón en la lista de variables de origen o de destino.
2. Seleccione Información sobre la variable.
Pasos básicos en el análisis de datos
Analizar datos con IBM SPSS Statistics es fácil. Simplemente tiene que:
Introducir los datos en IBM SPSS Statistics. Es posible abrir un archivo de datos IBM SPSS Statistics
previamente guardado, leer una hoja de cálculo, una base de datos o un archivo de datos de texto, o
introducir los datos directamente en el Editor de datos.
Seleccionar un procedimiento. Seleccione un procedimiento de los menús para calcular estadísticos o
crear un gráfico.
Seleccionar las variables para el análisis. Las variables del archivo de datos se muestran en un cuadro
de diálogo para el procedimiento.
Ejecute el procedimiento y observe los resultados. Los resultados se muestran en el Visor.
Asesor estadístico
Si no está familiarizado con IBM SPSS Statistics o con los procedimientos estadísticos disponibles, el
Asesor estadístico puede ayudarle solicitándole información mediante preguntas simples, utilizando un
lenguaje no técnico y ejemplos visuales que le ayudarán a seleccionar las características estadísticas y los
gráficos más apropiados para sus datos.
Para utilizar el Asesor estadístico, elija en los menús de cualquier ventana de IBM SPSS Statistics:
Ayuda >Asesor estadístico
4Guía del usuario de IBM SPSS Statistics 23 Core System
El Asesor estadístico cubre sólo un subconjunto selecto de procedimientos. Está diseñado para
proporcionar una asistencia general para muchas de las técnicas estadísticas básicas que se utilizan
habitualmente.
Información adicional
Si desea obtener una introducción global más detallada a los conceptos básicos, consulte el tutorial en
pantalla. En cualquier menú de IBM SPSS Statistics, elija:
Ayuda >Tutorial
Capítulo 1. Conceptos básicos 5
6Guía del usuario de IBM SPSS Statistics 23 Core System
Capítulo 2. Obtención de ayuda
La ayuda se proporciona de diversas formas:
Menú Ayuda. En la mayoría de las ventanas, el menú Ayuda proporciona acceso al sistema de ayuda
principal además de a los tutoriales y al material de referencia técnica.
vTemas. Proporciona acceso a las pestañas Contenido, Índice y Buscar, que pueden usarse para buscar
temas específicos de la Ayuda.
vTutorial. Instrucciones ilustradas paso a paso sobre cómo utilizar muchas de las características básicas.
No necesita consultar el tutorial de principio a fin. Puede elegir los temas que desea consultar, pasar de
un tema a otro, ver los temas en cualquier orden y utilizar el índice o la tabla de contenidos para
buscar temas concretos.
vEstudios de casos. Ejemplos prácticos sobre cómo crear diferentes tipos de análisis estadísticos y cómo
interpretar los resultados. También se proporcionan los archivos de datos de muestra utilizados en
estos ejemplos para que pueda trabajar en dichos ejemplos y observar con exactitud cómo se generaron
los resultados. Puede elegir los procedimientos concretos que desee aprender en la tabla de contenidos
o buscar los temas correspondientes en el índice.
vAsesor estadístico. Método de asistencia para orientarle en el proceso de búsqueda del procedimiento
que desea utilizar. Tras realizar una serie de selecciones, el Asesor estadístico abre el cuadro de diálogo
para el procedimiento estadístico, de generación de informes o de creación de gráficos que cumple los
criterios seleccionados.
vReferencia de sintaxis de comandos La información detallada de la referencia de sintaxis de
comandos está disponible de dos maneras: integrada en el sistema de ayuda global y como un
documento independiente en formato PDF en la referencia de sintaxis de comandos (Command Syntax
Reference), disponible en el menú Ayuda.
vAlgoritmos de estadísticos. Los algoritmos utilizados para la mayor parte de los procedimientos
estadísticos están disponibles de dos formas: integrados en el sistema de ayuda global y como un
documento independiente en formato PDF, disponible en el CD de manuales. Para los enlaces a
algoritmos específicos en el sistema de ayuda, seleccione Algoritmos en el menú Ayuda.
Ayuda contextual. En muchos puntos de la interfaz de usuario, puede obtener ayuda sensible al contexto.
vBotón Ayuda en los cuadros de diálogo. La mayoría de los cuadros de diálogo disponen de un botón
Ayuda que permite acceder directamente al tema de ayuda correspondiente. Este tema proporciona
información general y enlaces a los temas relacionados.
vMenú emergente Ayuda de la tabla dinámica. Pulse con el botón derecho del ratón en los términos
de una tabla dinámica activada en el Visor y seleccione ¿Qué es esto? en el menú emergente para ver
las definiciones de los términos.
vSintaxis de comandos. En una ventana de sintaxis de comandos, coloque el cursor en cualquier punto
de un bloque de sintaxis para un comando y pulse F1 en el teclado. Se muestra un esquema de sintaxis
de comandos completo para dicho comando. La documentación completa sobre la sintaxis de
comandos está disponible en los enlaces de la lista de temas relacionados y en la pestaña Contenido de
la ayuda.
Otros recursos
Sitio Web del servicio técnico. Es posible encontrar las respuestas a los problemas más comunes en
http://www.ibm.com/support. (El sitio Web de servicio técnico requiere un ID de inicio de sesión y una
contraseña. La información sobre cómo obtener el ID y la contraseña se facilita en la dirección URL
mencionada anteriormente.)
© Copyright IBM Corp. 1989, 2014 7
Si usted es un estudiante que utiliza una versión académica o para estudiantes de cualquier producto de
software IBM SPSS, consulte nuestras páginas especiales en línea de Soluciones educativas para
estudiantes. Si usted es estudiante y utiliza una copia proporcionada por la universidad del software IBM
SPSS, póngase en contacto con el coordinador del producto IBM SPSS en su universidad.
Comunidad de SPSS. La comunidad de SPSS dispone de recursos para todos los niveles de usuarios y
desarrolladores de aplicaciones. Descargue utilidades, ejemplos de gráficos, nuevos módulos estadísticos
y artículos. Visite la comunidad de SPSS en http://www.ibm.com/developerworks/spssdevcentral..
Obtención de ayuda sobre los términos de los resultados
Para ver la definición de un término de los resultados de la tabla dinámica en el Visor:
1. Pulse dos veces en la tabla dinámica para activarla.
2. Pulse con el botón derecho del ratón en el término del que desee obtener información.
3. Seleccione ¿Qué es esto? en el menú emergente.
Aparecerá una definición del término en una ventana emergente.
Demostración
8Guía del usuario de IBM SPSS Statistics 23 Core System
Capítulo 3. Archivos de datos
Los archivos de datos pueden tener formatos muy diversos, y este programa se ha sido diseñado para
trabajar con muchos de ellos, incluyendo:
vHojas de cálculo Excel
vTablas de base de datos de muchos orígenes de base de datos, incluidas Oracle, SQLServer, DB2 y otras
vDelimitado por tabuladores, CSV, y otros tipos de archivos de texto simples
vArchivos de datos de SAS
vArchivos de datos de Stata
Apertura de archivos de datos
Además de los archivos guardados en formato IBM SPSS Statistics, puede abrir archivos de Excel, SAS,
Stata, archivos delimitados por tabuladores y otros archivos sin necesidad de convertirlos a un formato
intermedio ni de introducir información sobre la definición de los datos.
vAbre un archivo de datos y lo convierte en el conjunto de datos activo. Si ya ha abierto uno o más
archivos de datos, permanecerán abiertos y disponibles para su uso posterior durante la sesión. Al
pulsar en cualquier punto de la ventana Editor de datos de un archivo de datos abierto lo convertirá
en el conjunto de datos activo. Consulte el tema Capítulo 6, “Trabajo con varios orígenes de datos”, en
la página 73 para obtener más información.
vEn el análisis en modo distribuido donde un servidor remoto procesa los comandos y ejecuta los
procedimientos, las unidades, carpetas y archivos de datos disponibles dependen de lo que esté
disponible en el servidor remoto. En la parte superior del cuadro de diálogo se indica el nombre del
servidor actual. Sólo tendrá acceso a los archivos de datos del equipo local si especifica la unidad como
un dispositivo compartido y las carpetas que contienen los archivos de datos como carpetas
compartidas. Consulte el tema Capítulo 4, “Análisis en modo distribuido”, en la página 49 para obtener
más información.
Para abrir archivos de datos
1. Elija en los menús:
Archivo >Abrir >Datos...
2. En el cuadro de diálogo Abrir datos, seleccione el archivo que desea abrir.
3. Pulse en Abrir.
Si lo desea, puede:
vEstablecer de forma automática la longitud de cada variable de cadena en el valor más largo observado
para dicha variable mediante Minimizar longitudes de cadena en función de los valores observados.
Esto es especialmente útil cuando se leen archivos de datos de página de código en modo Unicode.
Consulte el tema “Opciones generales” en la página 217 para obtener más información.
vLeer los nombres de las variables de la primera fila de los archivos de hoja de cálculo.
vEspecificar el rango de casillas que desee leer en los archivos de hojas de cálculo.
vEspecificar una hoja de trabajo dentro de un archivo de Excel que desee leer (Excel 95 o versiones
posteriores).
Para obtener información sobre la lectura de datos de bases de datos, consulte “Lectura de archivos de
bases de datos” en la página 12. Para obtener información sobre la lectura de datos de archivos de datos
de texto, consulte “Asistente para texto” en la página 18. Para obtener información sobre la lectura de
datos de IBM Cognos, consulte “Lectura de datos de Cognos BI” en la página 22.
© Copyright IBM Corp. 1989, 2014 9
Tipos de archivos de datos
SPSS Statistics. Abre archivos de datos que se guardan en el formato de IBM SPSS Statistics y también el
producto SPSS/PC+ para DOS.
SPSS Statistics comprimido. Abre archivos de datos que se guardan en el formato comprimido de IBM
SPSS Statistics.
SPSS/PC+. Abre archivos de datos de SPSS/PC+. Esta opción sólo está disponible en los sistemas
operativos Windows.
Portátil. Abre archivos de datos que se guardan en formato portátil. El almacenamiento de archivos en
este formato lleva mucho más tiempo que guardarlos en formato IBM SPSS Statistics.
Excel. Abre archivos de Excel.
Lotus 1-2-3. Abre archivos de datos que se guarda en formato 1-2-3 para el release 3.0, 2.0, o 1A de Lotus.
SYLK. Abre archivos de datos que se guardan en formato SYLK (enlace simbólico), un formato que
utilizan algunas aplicaciones de hoja de cálculo.
dBASE. Abre archivos con formato dBASE para dBASE IV, dBASE III o III PLUS, o dBASE II. Cada caso
es un registro. Las etiquetas de valor y de variable y las especificaciones de valores perdidos se pierden si
se guarda un archivo en este formato.
SAS. Versiones 6-9 de SAS y archivos de transporte SAS.
Stata. Stata versiones 4–13.
Opciones de apertura de archivos
Leer los nombres de variable. En las hojas de cálculo, puede leer los nombres de variable de la primera
fila del archivo o de la primera fila del rango definido. Los valores se convertirán según sea preciso para
crear nombres de variables válidos, incluyendo la conversión de espacios en subrayados.
Hoja de trabajo. Los archivos de Excel 95 o de versiones posteriores pueden contener varias hojas de
trabajo. El Editor de datos lee de forma predeterminada la primera hoja. Para leer una diferente,
seleccione la que desee en la lista desplegable.
Rango. En los archivos de hoja de cálculo, también puede leer un rango de casillas. Para especificar
rangos de casillas utilice el mismo método que empleará en la aplicación de hoja de cálculo.
Lectura de archivos de Excel
Lectura de archivos de Excel 95 o versiones posteriores
Las normas siguientes se aplican al leer archivos de Excel 95 o posteriores:
Tipo y ancho de datos. Cada columna es una variable. El tipo de datos y el ancho de cada variable está
determinado por el tipo de datos y el ancho en el archivo de Excel. Si la columna contiene más de un
tipo de datos (por ejemplo, fecha y numérico), el tipo de datos se define como cadena y todos los valores
se leen como valores de cadena válidos.
Casillas en blanco. En las variables numéricas, las casillas en blanco se convierten en el valor perdido del
sistema indicado por un punto (o una coma). En las variables de cadena, los espacios en blanco son
valores de cadena válidos y las casillas en blanco se tratan como valores de cadena válidos.
10 Guía del usuario de IBM SPSS Statistics 23 Core System
Nombres de variables. Si lee la primera fila del archivo de Excel (o la primera fila del rango
especificado) como nombres de variable, los valores que no cumplan las normas de denominación de
variables se convertirán en nombres de variables válidos y los nombres originales se utilizarán como
etiquetas de variable. Si no lee nombres de variable del archivo de Excel, se asignarán nombres de
variable predeterminados.
Lectura de archivos de Excel y otras hojas de cálculo de versiones
anteriores
Las siguientes normas se aplican para leer archivos de Excel de versiones anteriores a Excel 95 y otros
datos de hoja de cálculo:
Tipo y ancho de datos. El tipo y el ancho de los datos para cada variable se determinan según el ancho
de la columna y el tipo de datos de la primera casilla de la columna. Los valores de otro tipo se
convierten en valor perdido del sistema. Si la primera casilla de datos de la columna está en blanco, se
utiliza el tipo de datos global predeterminado para la hoja de cálculo (normalmente numérico).
Casillas en blanco. En las variables numéricas, las casillas en blanco se convierten en el valor perdido del
sistema indicado por un punto (o una coma). En las variables de cadena, los espacios en blanco son
valores de cadena válidos y las casillas en blanco se tratan como valores de cadena válidos.
Nombres de variables. Si no se leen los nombres de variable de la hoja de cálculo, se utilizan las letras
de las columnas (A,B,C,...) como nombres de variable de los archivos de Excel y de Lotus. Para los
archivos de SYLK y de Excel guardados en el formato de presentación R1C1, el programa utiliza para los
nombres de variable el número de la columna precedido por la letra C(C1,C2,C3,...).
Lectura de archivos de dBASE
Los archivos de bases de datos son, lógicamente, muy similares a los archivos de datos con formato IBM
SPSS Statistics. Las siguientes normas generales se aplican a los archivos de dBASE:
vLos nombres de campo se convierten en nombres de variable válidos.
vLos dos puntos en los nombres de campo de dBASE se convierten en subrayado.
vSe incluyen los registros marcados para ser eliminados que aún no se han purgado. El programa crea
una nueva variable de cadena, D_R, que incluye un asterisco en los casos marcados para su
eliminación.
Lectura de archivos de Stata
Las siguientes normas generales se aplican a los archivos de Stata:
vNombres de variables. Los nombres de variable de Stata se convierten en nombres de variable de IBM
SPSS Statistics en formato que distingue entre mayúsculas y minúsculas. Los nombres de variable de
Stata que sólo se diferencian en el uso de las mayúsculas y minúsculas se convierten en nombres de
variable válidos añadiendo un subrayado y una letra secuencial (_A,_B,_C, ..., _Z,_AA,_AB, ..., etc.).
vEtiquetas de variable. Las etiquetas de variable de Stata se convierten en etiquetas de variable de IBM
SPSS Statistics.
vEtiquetas de valor. Las etiquetas de valor de Stata se convierten en etiquetas de valor de IBM SPSS
Statistics, excepto las etiquetas de valor de Stata asignadas a valores perdidos "extendidos". Las
etiquetas de valor con más de 120 bytes de longitud se truncan.
vVariables de cadena. Las variables Stata strl se convierten a variables de cadena. Los valores con una
longitud superior a 32K bytes se truncan. Los valores Stata strl que contiene objetos grandes binarios
(blobs) se convierten a cadenas en blanco.
vValores perdidos. Los valores perdidos "extendidos" de Stata se convierten en valores perdidos del
sistema.
vConversión de fechas. Los valores de formato de fecha de Stata se convierten en valores con formato
DATE (d-m-a) de IBM SPSS Statistics. Los valores de formato de fecha de "serie temporal" de Stata
Capítulo 3. Archivos de datos 11
(semanas, meses, trimestres, etc.) se convierten a formato numérico simple (F), conservando el valor
entero interno original, que es el número de semanas, meses, trimestres, etc., desde el inicio de 1960.
Lectura de archivos de bases de datos
Podrá leer los datos desde cualquier formato de base de datos para los que disponga de un controlador
de base de datos. En el análisis en modo local, los controladores necesarios deben estar instalados en el
ordenador local. En el análisis en modo distribuido (disponible con IBM SPSS Statistics Server), los
controladores deben estar instalados en el servidor remoto. Consulte el tema Capítulo 4, “Análisis en
modo distribuido”, en la página 49 para obtener más información.
Nota: si tiene la versión de IBM SPSS Statistics para Windows de 64 bits, no podrá leer orígenes de bases
de datos Excel, Access o dBASE, aunqie pueden aparecer en la lista de orígenes de bases de datos
disponibles. Los controladores de ODBC de 32 bits de estos productos no son compatibles.
Para leer archivos de base de datos
1. Elija en los menús:
Archivo >Abrir base de datos >Nueva consulta...
2. Seleccione el origen de datos.
3. Si es necesario (según el origen de datos), seleccione el archivo de base de datos y/o escriba un
nombre de acceso, contraseña y demás información.
4. Seleccione las tablas y los campos. Para los orígenes de datos OLE DB (sólo disponibles en los
sistemas operativos Windows), únicamente puede seleccionar una tabla.
5. Especifique cualquier relación existente entre las tablas.
6. Si lo desea:
vEspecifique cualquier criterio de selección para los datos.
vAñada un mensaje solicitando al usuario que introduzca datos para crear una consulta con parámetros.
vGuarde la consulta creada antes de ejecutarla.
Agrupación de conexiones
Si accede al mismo origen de base de datos varias veces en la misma sesión o trabajo, puede mejorar el
rendimiento con la agrupación de conexiones.
1. En el último paso del asistente, pegue la sintaxis del comando en una ventana de sintaxis.
2. Al final de la cadena entrecomillada CONNECT, añada Pooling=true.
Para editar una consulta de base de datos guardada
1. Elija en los menús:
Archivo >Abrir base de datos >Editar consulta...
2. Seleccione el archivo de consulta (*.spq) que desee editar.
3. Siga las instrucciones para crear una consulta.
Para leer archivos de bases de datos con una consulta ODBC guardada
1. Elija en los menús:
Archivo >Abrir base de datos >Ejecutar consulta...
2. Seleccione el archivo de consulta (*.spq) que desee ejecutar.
3. Si es necesario (según el archivo de base de datos), introduzca un nombre de acceso y una contraseña.
4. Si la consulta tiene una solicitud incrustada, introduzca otra información necesaria (por ejemplo, el
trimestre para el que desee obtener cifras de ventas).
12 Guía del usuario de IBM SPSS Statistics 23 Core System
Selección de un origen de datos
Utilice la primera pantalla del Asistente para bases de datos para seleccionar el tipo de origen de datos
que se leerá.
Orígenes de datos ODBC
Si no tiene configurado ningún origen de datos ODBC o si desea añadir uno nuevo, pulse en Añadir
origen de datos ODBC.
vEn los sistemas operativos Linux, este botón no está disponible. Los orígenes de datos ODBC se
especifican en odbc.ini y es necesario especificar las variables de entorno ODBCINI con la ubicación de
dicho archivo. Si desea obtener más información, consulte la documentación de los controladores de la
base de datos.
vEn el análisis en modo distribuido (disponible con IBM SPSS Statistics Server), este botón no está
disponible. Para añadir orígenes de datos en el análisis en modo distribuido, consulte con el
administrador del sistema.
Un origen de datos ODBC está compuesto por dos partes esenciales de información: el controlador que se
utilizará para acceder a los datos y la ubicación de la base de datos a la que se desea acceder. Para
especificar los orígenes de datos, deberán estar instalados los controladores adecuados. El soporte de
instalación incluye controladores de una gran variedad de formatos de base de datos .
Para acceder a los orígenes de datos OLE DB (sólo disponibles en los sistemas operativos Windows), debe
tener instalados los siguientes elementos:
v.NET framework. Para obtener la versión más reciente de .NET framework, vaya a
http://www.microsoft.com/net.
vIBM SPSS Data Collection Survey Reporter Developer Kit. Para obtener información sobre la obtención
de una versión compatible de IBM SPSS Data Collection Survey Reporter Developer Kit, visite
www.ibm.com/support.
Las siguientes limitaciones son aplicables a los orígenes de datos de OLE DB:
vLas uniones entre tablas no están disponibles para los orígenes de datos OLE DB. Sólo se puede leer
una tabla al mismo tiempo.
vSe pueden añadir orígenes de datos OLE DB en análisis en modo local. Para añadir orígenes de datos
OLE DB en el análisis en modo distribuido en un servidor Windows, consulte con el administrador del
sistema.
vEn el análisis en modo distribuido (disponible con IBM SPSS Statistics Server), los orígenes de datos
OLE DB sólo están disponibles en servidores Windows, y debe tener instalado en el servidor .NET y
IBM SPSS Data Collection Survey Reporter Developer Kit.
Para añadir un origen de datos OLE DB:
1. Pulse en Añadir origen de datos OLE DB.
2. En las propiedades del enlace de datos, pulse en la pestaña Proveedor y seleccione el proveedor OLE
DB.
3. Pulse en Siguiente o en la pestaña Conexión.
4. Seleccione la base de datos introduciendo la ubicación del directorio y el nombre de base de datos o
pulsando en el botón para desplazarse hasta una base de datos. (Puede que también sean necesarios
un nombre de usuario y una contraseña.)
5. Pulse en Aceptar una vez que haya escrito toda la información necesaria. (Puede comprobar si la base
de datos especificada está disponible pulsando en el botón Probar conexión.)
6. Escriba un nombre para la información de conexión de base de datos. (Este nombre se mostrará en la
lista de orígenes de datos OLE DB disponibles.)
Capítulo 3. Archivos de datos 13
7. Pulse en Aceptar.
Volverá a la primera pantalla del Asistente para bases de datos, donde puede seleccionar el nombre
guardado de la lista de orígenes de datos OLE DB y continuar con el siguiente paso del asistente.
Eliminación de orígenes de datos OLE DB
Para eliminar nombres de orígenes de datos de la lista de orígenes de datos OLE DB, elimine el archivo
UDL que contiene el nombre del origen de datos:
[unidad]:\Documents and Settings\[nombre de usuario]\Local Settings\Application Data\SPSS\UDL
Selección de campos de datos
El paso de selección de datos controla las tablas y los campos que se deben leer. Los campos (las
columnas) de la base de datos se leen como variables.
Si una tabla tiene un campo cualquiera seleccionado, todos sus campos serán visibles en las ventanas
subsiguientes del Asistente para bases de datos; sin embargo, sólo se importarán como variables los
campos seleccionados en este paso. Esto le permitirá crear uniones entre tablas y especificar criterios
empleando los campos que no esté importando.
Presentación de los nombres de los campos. Para ver los campos de la tabla, pulse en el signo más (+)
situado a la izquierda del nombre de una tabla. Para ocultar los campos pulse en el signo menos (-)
situado a la izquierda del nombre de una tabla.
Para añadir un campo. Pulse dos veces en cualquier campo de la lista Tablas disponibles o arrástrelo
hasta la lista Recuperar los campos en este orden. Los campos se pueden volver a ordenar arrastrándolos
y colocándolos dentro de la lista de campos.
Para eliminar un campo. Pulse dos veces en cualquier campo de la lista Recuperar los campos en este
orden, o bien arrástrelo hasta la lista Tablas disponibles.
Ordenar los nombres de campo. Si se selecciona, el Asistente para bases de datos mostrará los campos
disponibles en orden alfabético.
De forma predeterminada, la lista muestra sólo las tablas disponibles de bases de datos estándar. Puede
controlar el tipo de elementos que se muestran en la lista:
vTablas. Tablas de base de datos estándar.
vVistas. Las vistas son "tablas" virtuales o dinámicas definidas por consultas. Estas tablas pueden
incluir uniones de varias tablas y/o campos derivados de cálculos basados en los valores de otros
campos.
vSinónimos. Un sinónimo es un alias para una tabla o vista que suele estar definido en una consulta.
vTablas del sistema. Las tablas del sistema definen propiedades de la base de datos. En algunos casos,
las tablas de base de datos estándar pueden estar clasificadas como tablas del sistema y sólo se
mostrarán si se selecciona esta opción. El acceso a tablas del sistema reales suele estar limitado a los
administradores de la base de datos.
Nota: para los orígenes de datos OLE DB (sólo disponibles en los sistemas operativos Windows),
únicamente puede seleccionar los campos de una sola tabla. Las uniones entre varias tablas no son
compatibles con los orígenes de datos OLE DB.
Creación de una relación entre tablas
El paso Especificar relaciones permite definir relaciones entre las tablas para orígenes de datos ODBC. Si
selecciona campos de más de una tabla, deberá definir al menos una unión.
14 Guía del usuario de IBM SPSS Statistics 23 Core System
Establecimiento de relaciones. Para crear una relación, arrastre un campo desde cualquier tabla hasta el
campo con el que quiera unirlo. El Asistente para bases de datos dibujará una línea de unión entre los
dos campos que indica su relación. Estos campos deben ser del mismo tipo de datos.
Unir tablas automáticamente. Intenta unir las tablas automáticamente en función de las claves
primarias/externas o de los nombres de campo y tipos de datos coincidentes.
Tipo de unión Si el controlador permite uniones exteriores, podrá especificar uniones interiores, uniones
exteriores izquierdas o uniones exteriores derechas.
vUniones interiores. Una unión interior incluye sólo las filas donde los campos relacionados son
iguales. En este ejemplo, se incluirán todas las filas con los mismos valores de ID.
vUniones exteriores. Además de las coincidencias de uno a uno con uniones interiores, también puede
utilizar uniones exteriores para fusionar tablas con un esquema de coincidencia de uno a varios. Por
ejemplo, puede hacer una coincidencia con una tabla donde sólo hay algunos registros que representan
los valores de datos y las etiquetas descriptivas asociadas, con valores en una tabla que contiene
cientos o miles de registros que representan los encuestados. Una unión exterior izquierda incluye
todos los registros de la tabla izquierda y sólo aquellos registros de la tabla derecha en los que los
campos relacionados son iguales. En una unión exterior derecha, se importan todos los registros de la
tabla derecha y sólo aquellos registros de la tabla izquierda en los que los campos relacionados son
iguales.
Cálculo de nuevos campos
Si está en modalidad distribuida, conectado a un servidor remoto (disponible con IBM SPSS Statistics
Server), podrá calcular nuevos campos antes de leer los datos en IBM SPSS Statistics.
También puede calcular nuevos campos después de leer los datos en IBM SPSS Statistics, pero si calcula
nuevos campos en la base de datos ahorrará tiempo en el caso de orígenes de datos de gran tamaño.
Nuevo nombre de campo. El nombre debe cumplir con las reglas de nombres de IBM SPSS Statistics.
Expresión. Escriba la expresión para calcular el nuevo campo. Puede arrastrar los nombres de campo
existentes a la lista Campos y las funciones desde la lista Funciones.
Limitar la recuperación de casos
Este paso permite especificar el criterio para seleccionar subconjuntos de casos (filas). La limitación de los
casos consiste generalmente en rellenar la cuadrícula de criterios con uno o varios criterios. Los criterios
constan de dos expresiones y de alguna relación entre ellas, y devuelven un valor verdadero,falso operdido
para cada caso.
vSi el resultado es verdadero, se selecciona el caso.
vSi el resultado es falso operdido, no se selecciona el caso.
vLa mayoría de los criterios utiliza al menos uno de los seis operadores de relación (<, >, <=, >=, = y
<>).
vLas expresiones pueden incluir nombres de campo, constantes, operadores aritméticos, funciones
numéricas y de otros tipos, y variables lógicas. Puede utilizar como variables los campos que no vaya a
importar.
Para crear sus criterios necesita por lo menos dos expresiones y una relación para conectarlas.
1. Para crear una expresión, seleccione uno de los siguientes métodos:
vEn una casilla Expresión, puede escribir nombres de campo, constantes, operadores aritméticos,
funciones numéricas y de otro tipo, y variables lógicas.
vPulse dos veces en el campo de la lista Campos.
vArrastre el campo de la lista Campos hasta la casilla Expresión.
vSeleccione un campo del menú desplegable en una casilla Expresión activa.
Capítulo 3. Archivos de datos 15
2. Para elegir el operador relacional (como = o >), sitúe el cursor en la casilla Relación y escriba el tipo
de operador o selecciónelo en el menú desplegable.
Si SQL contiene las cláusulas WHERE con expresiones para la selección de casos, las fechas y las horas
de las expresiones deberán especificarse de un modo especial (incluidas las llaves que se muestran en
los ejemplos:)
vLos literales de fecha deben especificarse usando el formato general {d ’aaaa-mm-dd’}.
vLos literales de hora deben especificarse usando el formato general {t ’hh:mm:ss’}.
vLos literales de fecha y hora (marcas de hora) se deben especificar usando el formato general {ts
’aaaa-mm-dd hh:mm:ss’}.
vEl valor completo de fecha y/o hora debe ir entre comillas simples. Los años se deben expresar en
formato de cuatro dígitos y las fechas y horas deben contener dos dígitos para cada parte del valor.
Por ejemplo, 1 de enero de 2005, 1:05 AM se expresaría como:
{ts ’2005-01-01 01:05:00’}
Funciones. Se ofrece una selección de funciones preincorporadas SQL aritméticas, lógicas, de cadena,
de fecha y de hora. Puede arrastrar una función de la lista hasta la expresión, o introducir una
función SQL válida. Consulte la documentación de la base de datos para obtener funciones SQL
válidas. Hay una lista de funciones estándar disponibles en:
Utilizar muestreo aleatorio. Esta opción selecciona una muestra aleatoria de casos del origen de
datos. Para grandes orígenes de datos, es posible que desee limitar el número de casos a una pequeña
y representativa muestra, lo que reduce considerablemente el tiempo de ejecución de procesos. Si el
muestreo aleatorio original se encuentra disponible para el origen de datos, resulta más rápido que el
muestreo aleatorio de IBM SPSS Statistics dado que IBM SPSS Statistics aún debe leer todo el origen
de datos para extraer una muestra aleatoria.
vAproximadamente. Genera una muestra aleatoria con el porcentaje aproximado de casos indicado.
Dado que esta rutina toma una decisión pseudoaleatoria para cada caso, el porcentaje de casos
seleccionados sólo se puede aproximar al especificado. Cuantos más casos contenga el archivo de
datos, más se acercará el porcentaje de casos seleccionados al porcentaje especificado.
vExactamente. Selecciona una muestra aleatoria con el número de casos especificado a partir del
número total de casos especificado. Si el número total de casos especificado supera el número total
de casos presentes en el archivo de datos, la muestra contendrá un número menor de casos
proporcional al número solicitado.
Nota: si utiliza el muestreo aleatorio, agregación (disponible en el modo distribuido con IBM SPSS
Statistics Server) no estará disponible.
Pedir el valor al usuario. Permite insertar una solicitud en la consulta para crear una consulta con
parámetros. Cuando un usuario ejecute la consulta, se le solicitará que introduzca los datos (según lo
que se haya especificado aquí). Puede interesarle esta opción si necesita obtener diferentes vistas de
los mismos datos. Por ejemplo, es posible que desee ejecutar la misma consulta para ver las cifras de
ventas de diversos trimestres fiscales.
3. Sitúe el cursor en cualquier casilla de expresión y pulse en Pedir el valor al usuario para crear una
petición.
Creación de una consulta con parámetros
Utilice el paso Pedir el valor al usuario para crear un cuadro de diálogo que solicite información al
usuario cada vez que ejecute su consulta. Esta característica resulta útil para realizar consultas de un
mismo origen de datos empleando criterios diferentes.
Para crear una solicitud, introduzca una cadena de petición y un valor predeterminado. Esta cadena
aparecerá cada vez que un usuario ejecute la consulta. La cadena especificará el tipo de información que
debe introducir. Si la información no se ofrece en una lista, la cadena sugerirá el formato que debe
aplicarse a la información. El siguiente es un ejemplo: Introduzca un trimestre (Q1, Q2, Q3, ...).
16 Guía del usuario de IBM SPSS Statistics 23 Core System
Permitir al usuario seleccionar el valor de la lista. Si selecciona esta casilla de verificación, puede limitar
las elecciones del usuario a los valores que incluya en esta lista. Asegúrese de que los valores se separan
por retornos de carro.
Tipo de datos. Seleccione aquí el tipo de datos (Número,Cadena oFecha).
Los valores de fecha y hora deberán especificarse de manera especial:
vLos valores de fecha deben utilizar el formato general aaaa-mm-dd.
vLos valores de hora deben utilizar el formato general: hh:mm:ss.
vLos valores de fecha/hora (marcas de tiempo) deben utilizar el formato general aaaa-mm-dd hh:mm:ss.
Adición de Datos
Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con el servidor IBM
SPSS Statistics), podrá agregar los datos antes de leerlos en IBM SPSS Statistics.
También se pueden agregar los datos después de leerlos en IBM SPSS Statistics, pero si lo hace antes
ahorrará tiempo en el caso de grandes orígenes de datos.
1. Para crear datos agregados, seleccione una o más variables de segmentación que definan cómo deben
agruparse los casos.
2. Seleccione una o varias variables agregadas.
3. Seleccione una función de agregación para cada variable agregada.
4. Si lo desea, cree una variable que contenga el número de casos en cada grupo de segmentación.
Nota: si utiliza el muestreo aleatorio de IBM SPSS Statistics, la agregación no estará disponible.
Definición de variables
Nombres y etiquetas de variables. El nombre completo del campo (columna) de la base de datos se
utiliza como etiqueta de la variable. A menos que modifique el nombre de la variable, el Asistente para
bases de datos asignará nombres de variable a cada columna de la base de datos de una de las siguientes
formas:
vSi el nombre del campo de la base de datos forma un nombre de variable válido y exclusivo, se usará
como el nombre de la variable.
vSi el nombre del campo de la base de datos no es un nombre de variable válido y exclusivo, se
generará automáticamente un nombre único.
Pulse en cualquier casilla para editar el nombre de la variable.
Conversión de cadenas en variables numéricas. Seleccione la casilla Recodificar como numérica para
convertir automáticamente una variable de cadena en una variable numérica. Los valores de cadena se
convierten en valores enteros consecutivos en función del orden alfabético de los valores originales. Los
valores originales se mantienen como etiquetas de valor para las nuevas variables.
Anchura para los campos de ancho variable. Esta opción controla la anchura de los valores de las
cadenas de anchura variable. De forma predeterminada, la anchura es de 255 bytes y sólo se leen los
primeros 255 bytes (generalmente 255 caracteres en idiomas de un solo byte). El valor máximo que se
puede asignar a este parámetro es de 32.767 bytes. Aunque posiblemente no desee truncar los valores de
cadena, tampoco deseará especificar un valor innecesariamente alto, ya que produciría que el
procesamiento fuera ineficaz.
Minimizar las longitudes de cadena en función de los valores observados. Establece automáticamente
el ancho de cada variable de cadena al valor observado más largo.
Capítulo 3. Archivos de datos 17
Ordenación de casos
Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con IBM SPSS Statistics
Server), podrá agregar los datos antes de leerlos en IBM SPSS Statistics.
También se pueden ordenar los datos después de leerlos en IBM SPSS Statistics, pero si lo hace antes
ahorrará tiempo en el caso de grandes orígenes de datos.
Resultados
El paso Resultados muestra la sentencia Select de SQL para la consulta.
vSe puede editar la sentencia Select de SQL antes de ejecutar la consulta, pero si pulsa el botón Anterior
para introducir cambios en pasos anteriores, se perderán los cambios realizados en la sentencia Select.
vPara guardar la consulta para utilizarla más adelante, utilice la sección Guardar la consulta en un
archivo.
vPara pegar la sintaxis GET DATA completa en una ventana de sintaxis, seleccione Pegarlo en el editor de
sintaxis para su modificación ulterior. Copiar y pegar la sentencia Select de la ventana Resultados no
pegará la sintaxis de comandos necesaria.
Nota: La sintaxis pegada contiene un espacio en blanco delante de las comillas de cierre en cada línea de
SQL generada por el asistente. Estos espacios no son superfluos. Cuando se procesa el comando, todas las
líneas de la sentencia SQL se fusionan de un modo muy literal. Si esos espacios, los caracteres último y
primero de cada línea se unirían.
Asistente para texto
El Asistente para la importación de texto puede leer archivos de datos de texto de diversos formatos:
vArchivos delimitados por tabuladores
vArchivos delimitados por espacios
vArchivos delimitados por comas
vArchivos con formato de campos fijos
En los archivos delimitados, también se pueden especificar otros caracteres como delimitadores entre
valores, o bien especificar varios delimitadores diferentes.
Para leer archivos de datos de texto
1. Elija en los menús:
Archivo >Leer datos de texto...
2. Seleccione el archivo de texto en el cuadro de diálogo Abrir datos.
3. En caso necesario, seleccione la codificación del archivo.
4. Siga los pasos indicados en el Asistente para la importación de texto para definir cómo desea leer el
archivo de datos de texto.
Demostración
Codificación
La codificación de un archivo afecta a la forma como se leen los datos de carácter. Los archivos de datos
Unicode normalmente contienen una marca de orden de byte que identifica la codificación de caracteres.
Algunas aplicaciones crean archivos Unicode sin una marca de orden de byte y los archivos de datos de
páginas de códigos no contienen ningún identificador de codificación.
vUnicode (UTF-8). Lee el archivo como Unicode UTF-8.
vUnicode (UTF-16). Lee el archivo como Unicode UTF-16 en la alineación del sistema operativo.
vUnicode (UTF-16BE). Lee el archivo como Unicode UTF-16, big endian.
vUnicode (UTF-16LE). Lee el archivo como Unicode UTF-16, little endian.
18 Guía del usuario de IBM SPSS Statistics 23 Core System
vCodificación local. Lee el archivo en la codificación de caracteres de la página de códigos del entorno
local actual.
Si un archivo contiene una marca de orden de byte Unicode, se lee en la codificación Unicode,
independientemente de la codificación que seleccione. Si un archivo no contiene una marca de orden de
byte Unicode, de forma predeterminada, se presupone que la codificación es la codificación de caracteres
de la página de códigos del entorno local actual, a menos que seleccione una de las codificaciones
Unicode.
Para cambiar el entorno local actual para archivos de datos en una codificación de caracteres de página
de códigos diferente, seleccione Editar>Opciones en los menús y cambie el entorno local en la pestaña
Idioma.
Asistente para la importación de texto: paso 1
El archivo de texto se mostrará en una ventana de vista previa. Puede aplicar un formato predefinido
(guardado con anterioridad desde el Asistente para la importación de texto) o seguir los pasos del
asistente para especificar cómo desea que se lean los datos.
Asistente para la importación de texto: paso 2
Este paso ofrece información sobre las variables. Una de las variables es similar a uno de los campos de
la base de datos. Por ejemplo, cada elemento de un cuestionario es una variable.
¿Cómo están organizadas sus variables? Para leer los datos adecuadamente, el Asistente para la
importación de texto necesita saber cómo determinar el lugar en el que terminan los valores de datos de
una variable y comienzan los valores de datos de la variable siguiente. La organización de las variables
define el método utilizado para diferenciar una variable de la siguiente.
vDelimitado. Se utilizan espacios, comas, tabulaciones u otros caracteres para separar variables. Las
variables quedan registradas en el mismo orden para cada caso, pero no necesariamente conservando
la misma ubicación para las columnas.
vAncho fijo. Cada variable se registra en la misma posición de columna en el mismo registro (línea)
para cada caso del archivo de datos. No se requiere delimitador entre variables De hecho, en muchos
archivos de datos de texto generados por programas de ordenador, podría parecer que los valores de
los datos se suceden, sin espacios que los separen. La ubicación de la columna determina qué variable
se está leyendo.
Nota: el Asistente para la importación de texto no puede leer archivos de texto Unicode de ancho fijo.
Puede utilizar el comando DATA LIST para leer archivos Unicode de ancho fijo.
¿Están incluidos los nombres de las variables en la parte superior del archivo? Si la primera fila del
archivo de datos contiene etiquetas descriptivas para cada variable, podrá utilizar dichas etiquetas como
nombres de las variables. Los valores que no cumplan las normas de denominación de variables se
convertirán en nombres de variables válidos.
Asistente para la importación de texto: paso 3 (archivos delimitados)
Este paso ofrece información sobre los casos. Un caso es similar a un registro de una base de datos. Por
ejemplo, cada persona que responde a un cuestionario es un caso.
¿En qué número de línea comienza el primer caso de datos? Indica la primera línea del archivo de datos
que contiene valores de datos. Si la línea o líneas superiores del archivo de datos contienen etiquetas
descriptivas o cualquier otro texto que no represente valores de datos, dicha línea o líneas no serán la
línea 1.
¿Cómo se representan sus casos? Controla la manera en que el Asistente para la importación de texto
determina dónde finaliza cada caso y comienza el siguiente.
vCada línea representa un caso. Cada línea contiene un sólo caso. Es bastante común que cada línea
(fila) contenga un sólo caso, aunque dicha línea puede ser muy larga para un archivo de datos con un
Capítulo 3. Archivos de datos 19
gran número de variables. Si no todas las líneas contienen el mismo número de valores de datos, el
número de variables para cada caso quedará determinado por la línea que tenga el mayor número de
valores de datos. A los casos con menos valores de datos se les asignarán valores perdidos para las
variables adicionales.
vUn número concreto de variables representa un caso. El número de variables especificado para cada
caso informa al Asistente para la importación de texto de dónde detener la lectura de un caso y
comenzar la del siguiente. Una misma línea puede contener varios casos y los casos pueden empezar
en medio de una línea y continuar en la línea siguiente. El Asistente para la importación de texto
determina el final de cada caso basándose en el número de valores leídos, independientemente del
número de líneas. Cada caso debe contener valores de datos (o valores perdidos indicados por
delimitadores) para todas las variables; de otra forma, el archivo de datos no se leerá correctamente.
¿Cuántos casos desea importar? Puede importar todos los casos del archivo de datos, los primeros n
casos (siendo nun número especificado por el usuario) o una muestra aleatoria a partir de un porcentaje
especificado. Dado que esta rutina de muestreo aleatorio toma una decisión pseudo-aleatoria para cada
caso, el porcentaje de casos seleccionados sólo se puede aproximar al porcentaje especificado. Cuantos
más casos contenga el archivo de datos, más se acercará el porcentaje de casos seleccionados al porcentaje
especificado.
Asistente para la importación de texto: paso 3 (archivos de ancho fijo)
Este paso ofrece información sobre los casos. Un caso es similar a un registro de una base de datos. Por
ejemplo, cada encuestado es un caso.
¿En qué número de línea comienza el primer caso de datos? Indica la primera línea del archivo de datos
que contiene valores de datos. Si la línea o líneas superiores del archivo de datos contienen etiquetas
descriptivas o cualquier otro texto que no represente valores de datos, dicha línea o líneas no serán la
línea 1.
¿Cuántas líneas representan un caso? Controla la manera en que el Asistente para la importación de
texto determina dónde finaliza cada caso y comienza el siguiente. Cada variable queda definida por su
número de línea dentro del caso y por la ubicación de su columna. Para leer los datos correctamente,
deberá especificar el número de líneas de cada caso.
¿Cuántos casos desea importar? Puede importar todos los casos del archivo de datos, los primeros n
casos (siendo nun número especificado por el usuario) o una muestra aleatoria a partir de un porcentaje
especificado. Dado que esta rutina de muestreo aleatorio toma una decisión pseudo-aleatoria para cada
caso, el porcentaje de casos seleccionados sólo se puede aproximar al porcentaje especificado. Cuantos
más casos contenga el archivo de datos, más se acercará el porcentaje de casos seleccionados al porcentaje
especificado.
Asistente para la importación de texto: paso 4 (archivos delimitados)
Este paso muestra la mejor opción, según el Asistente para la importación de texto, para leer el archivo
de datos y le permite modificar la manera en que el asistente leerá las variables del archivo de datos.
¿Qué delimitador desea para la separación entre variables? Indica los caracteres o símbolos que separan
los valores de datos. Puede seleccionar cualquier combinación de espacios, comas, signos de punto y
coma, tabulaciones o cualquier otro carácter. En caso de existir varios delimitadores consecutivos sin
valores de datos, dichos delimitadores serán considerados valores perdidos.
¿Cuál es el calificador de texto? Caracteres utilizados para encerrar valores que contienen caracteres
delimitadores. Por ejemplo, si una coma es el delimitador, los valores que contengan comas se leerán
incorrectamente a menos que estos valores se encierre en un calificador de texto, impidiendo que las
comas del valor se interpreten como delimitadores entre los valores. Los archivos de datos con formato
CSV de Excel utilizan las comillas dobles (") como calificador de texto. El calificador de texto aparece
tanto al comienzo como al final del valor, encerrándolo completamente.
20 Guía del usuario de IBM SPSS Statistics 23 Core System
Asistente para la importación de texto: paso 4 (archivos de ancho fijo)
Este paso muestra la mejor opción, según el Asistente para la importación de texto, para leer el archivo
de datos y le permite modificar la manera en que el asistente leerá las variables del archivo de datos. Las
líneas verticales de la ventana de vista previa indican el lugar en el que en ese momento el Asistente para
la importación de texto piensa que cada variable comienza en el archivo.
Inserte, mueva y elimine líneas de ruptura de variable según convenga para separar variables. Si se
utilizan varias líneas para cada caso, los datos aparecerán como una línea para cada caso y las líneas
posteriores se adjuntarán al final de la línea.
Notas:
En archivos de datos generados por ordenador que producen un flujo continuo de valores de datos sin
espacios ni otras características distintivas, puede resultar difícil determinar el lugar en el que comienza
cada variable. Los archivos de datos del tipo citado anteriormente suelen depender de un archivo de
definición de datos u otro tipo de descripción escrita que especifique la ubicación por líneas y columnas
de cada variable.
Asistente para la importación de texto: paso 5
Este paso controla el nombre de la variable y el formato de datos que el Asistente para la importación de
texto utilizará para leer cada variable, así como las que se incluirán en el archivo de datos definitivo.
Nombre de variable. Puede sobrescribir los nombres de variable predeterminados y sustituirlos por otros
diferentes. Si lee nombres de variable desde el archivo de datos, el Asistente para la importación de texto
modificará de manera automática los nombres de variable que no cumplan las normas de denominación
de variables. Seleccione una variable en la ventana de vista previa e introduzca un nombre de variable.
Formato de datos. Seleccione una variable en la ventana de vista previa y, a continuación, seleccione un
formato de la lista desplegable. Pulse el botón del ratón con la tecla MAYÚS presionada para seleccionar
una serie de variables consecutivas, o bien con la tecla CTRL presionada para seleccionar una serie de
variables no consecutivas.
El formato predeterminado se determina en los valores de datos de las primeras 250 filas. Si se detecta
más de un formato (por ejemplo, numérico, de fecha, de cadena) en las primeras 250 filas, el formato
predefinido se define a cadena.
Opciones para el formato del Asistente para la importación de texto: Entre las opciones de formato
para la lectura de variables con el Asistente para la importación de texto se encuentran:
No importar. Omite la variable o variables seleccionadas del archivo de datos importado.
Numérico. Los valores válidos incluyen números, los signos más y menos iniciales y un indicador
decimal.
Cadena. Son valores válidos prácticamente todos los caracteres del teclado y los espacios en blanco
incrustados. En los archivos delimitados, puede especificar hasta un máximo de 32.767 de caracteres para
el valor. El Asistente para la importación de texto fija como valor predeterminado para el número de
caracteres el valor de cadena más largo que se haya encontrado para la variable o variables seleccionadas
en las primeras 250 filas del archivo. Para los archivos de ancho fijo, el número de caracteres en los
valores de cadena queda definido por la ubicación de las líneas de ruptura de variable en el paso 4.
Fecha/hora. Entre los valores válidos se encuentran las fechas con formato general: dd-mm-aaaa,
mm/dd/aaaa,dd.mm.aaaa,aaaa/mm/dd,hh:mm:ss, así como una amplia variedad de formatos de hora y fecha.
Los meses se pueden representar en dígitos, números romanos, abreviaturas de tres letras o con el
nombre completo. Seleccione un formato de fecha de la lista.
Capítulo 3. Archivos de datos 21
Dólar. Los valores válidos son números con un signo dólar inicial optativo y puntos separadores de
millares también optativos.
Coma. Entre los valores válidos se encuentran los números que utilizan un punto para separar los
decimales y una coma para separar los millares.
Punto. Entre los valores válidos se encuentran los números que utilizan una coma para separar los
decimales y un punto para separar los millares.
Nota: los valores que contengan caracteres no válidos para el formato seleccionado serán considerados
valores perdidos. Los valores que contengan uno cualquiera de los delimitadores especificados serán
considerados como valores múltiples.
Asistente para la importación de texto: paso 6
Este es el paso final del Asistente para la importación de texto. Puede guardar sus propias
especificaciones en un archivo para hacer uso de ellas cuando importe archivos de datos de texto
similares. También puede pegar la sintaxis generada por el Asistente para la importación de texto en una
ventana de sintaxis. Así podrá personalizar y/o guardar dicha sintaxis para utilizarla en futuras sesiones
o en trabajos de producción.
Caché local de los datos. Una caché de datos es una copia completa del archivo de datos almacenada en un
espacio de disco temporal. La caché del archivo de datos puede mejorar el rendimiento.
Lectura de datos de Cognos BI
Si tiene acceso a un servidor de IBM Cognos Business Intelligence, puede leer paquetes de datos e
informes de listas de IBM Cognos Business Intelligence en IBM SPSS Statistics.
Para leer datos de IBM Cognos Business Intelligence:
1. Elija en los menús:
Archivo >Leer datos de Cognos >Leer datos de Cognos BI
2. Especifique la URL de la conexión del servidor de IBM Cognos Business Intelligence.
3. Especifique la ubicación del paquete de datos o informe.
4. Seleccione los campos de datos o el informe que desee leer.
Si lo desea, puede:
vSeleccionar filtros de paquetes de datos.
vImportar datos agregados en lugar de datos en bruto.
vEspecificar valores de parámetro.
Modo. Especifica el tipo de información que desea leer: Datos oInforme. El único tipo de informe que se
puede leer es un informe de lista.
Conexión. La URL del servidor de Cognos Business Intelligence. Haga clic en el botón Editar para definir
los detalles de una nueva conexión de Cognos desde la que importar datos o informes. Consulte el tema
“Conexiones de Cognos” en la página 23 para obtener más información.
Posición. La ubicación del paquete o informe que desea leer. Haga clic en el botón Editar para ver una
lista de orígenes disponibles desde los que importar contenidos. Consulte el tema “Ubicación de Cognos”
en la página 23 para obtener más información.
Contenido. En datos, muestra los paquetes y filtros de datos disponibles. En informes, muestra los
informes disponibles.
22 Guía del usuario de IBM SPSS Statistics 23 Core System
Campos para importar. En los paquetes de datos, seleccione los campos que desee incluir y muévalos a
esta lista.
Informe para importar. En informes, seleccione el informe de lista que desea importar. El informe debe
ser un informe de lista.
Filtros para aplicar. En los paquetes de datos, seleccione los filtros que desee aplicar y muévalos a esta
lista.
Parámetros. Si este botón está activado, el objeto seleccionado tiene los parámetros definidos. Puede
utilizar los parámetros para realizar ajustes (por ejemplo, realizar un cálculo parametrizado) antes de
importar los datos. Si los parámetros están definidos pero no se proporcionan los predeterminados, el
botón muestra un triángulo de advertencia.
Agregar datos antes de realizar una importación. En paquetes de datos, si se define la agregación en el
paquete, puede importar los datos agregados en lugar de los datos en bruto.
Conexiones de Cognos
El cuadro de diálogo Conexiones de Cognos especifica la URL del servidor de IBM Cognos Business
Intelligence y cualquier credencial necesaria adicional.
URL de servidor de Cognos. La URL del servidor de IBM Cognos Business Intelligence. Es el valor de la
propiedad del entorno de "URI de distribuidor externo" de la configuración de IBM Cognos en el
servidor. Póngase en contacto con el administrador de su sistema para obtener más información.
Modo. Seleccione Establecer credenciales si necesita iniciar sesión con un espacio de nombre, nombre de
usuario y contraseña específica (por ejemplo, como administrador). Seleccione Usar conexión anónima
para iniciar sesión sin credenciales de usuario, en cuyo caso no necesitará cumplimentar el resto de
campos. Seleccione Credenciales almacenadas para utilizar la información de inicio de sesión de una
credencial almacenada. Para utilizar una credencial almacenada, debe estar conectado al IBM SPSS
Collaboration and Deployment Services Repository que contiene la credencial. Una vez que esté
conectado al repositorio, pulse Examinar para ver la lista de credenciales disponibles.
ID de espacio de nombres. El proveedor de seguridad para la autenticación que se utiliza para iniciar
sesión en el servidor. El proveedor de autenticación se utiliza para definir y mantener usuarios, grupos y
papeles y para controlar el proceso de autenticación.
Nombre de usuario. Introduzca el nombre de usuario con el que iniciará sesión en el servidor.
Contraseña. Introduzca la contraseña asociada con el nombre de usuario especificado.
Guardar como predeterminado. Guarda estas configuraciones como predeterminadas, para evitar tener
que volver a introducirlas cada vez.
Ubicación de Cognos
El cuadro de diálogo Especificar ubicación permite seleccionar un paquete desde el que importar los
datos o un paquete o carpeta desde la que importar informes. Muestra las carpetas públicas que tiene
disponibles. Si selecciona Datos en el cuadro de diálogo principal, la lista mostrará carpetas con paquetes
de datos. Si selecciona Informe en el cuadro de diálogo principal, la lista mostrará carpetas con informes
de lista. Seleccione la ubicación que desee desplazándose por la estructura de carpetas.
Especificación de parámetros de datos o informes
Si se han definido los parámetros de un objeto o informe de datos, puede especificar valores para estos
parámetros antes de importar los datos o informes. Un ejemplo de parámetros de un informe serían las
fechas de inicio y de fin del contenido del informe.
Capítulo 3. Archivos de datos 23
Nombre. El nombre del parámetro tal y como se especifica en la base de datos de IBM Cognos Business
Intelligence.
Tipo. Una descripción del parámetro.
Valor. El valor que se asignará al parámetro. Para introducir o editar un valor, haga doble clic en su
casilla en la tabla. Los valores no se validan aquí; todos los valores no válidos se detectan en el momento
de la ejecución.
Eliminar automáticamente los parámetros no válidos de la tabla. Esta opción está seleccionada de forma
predeterminada y eliminará cualquier parámetro no válido que se encuentre en el objeto o informe de
datos.
Cambio de nombres de variable
En paquetes de datos de IBM Cognos Business Intelligence, los nombres del campo de paquete se
convierten automáticamente a nombres válidos de variables. Puede usar la pestaña Campos del cuadro
de diálogo Leer datos de Cognos para sustituir los nombres predefinidos. Los nombres deben ser
exclusivos y cumplir las reglas de nombres de variable. Consulte el tema “Nombres de variable” en la
página 56 para obtener más información.
Lectura de datos de Cognos TM1
Si tiene acceso a una base de datos de IBM Cognos TM1, puede importar datos de TM1 de una vista
especificada a IBM SPSS Statistics. Los datos del cubo OLAP multidimensional de TM1 se presentan
cuando se leen en SPSS Statistics.
Importante: Para permitir el intercambio de datos entre SPSS Statistics y TM1, debe copiar los siguientes
tres prcoesos de SPSS Statistics al servidor TM1: ExportToSPSS.pro,ImportFromSPSS.pro,y
SPSSCreateNewMeasures.pro. Para añadir estos procesos al servidor TM1, debe copiarlos en el directorio
de datos del servidor TM1 y reiniciar el servidor TM1. Estos archivos están disponibles desde el
directorio common/scripts/TM1 en el directorio de instalación de SPSS Statistics.
Restricción:
vLa vista de TM1 desde la cual realiza la importación debe incluir uno o más elementos de una
dimensión de medida.
vLos datos que se van a importar desde TM1 deben tener el formato UTF-8.
Se importan todos los datos de la vista de TM1 especificada. Por lo tanto, lo mejor es limitar la vista en
los datos que son necesarios para el análisis. Cualquier filtrado necesario de los datos se realiza mejor en
TM1, por ejemplo, con el editor de subconjuntos de TM1.
Para leer datos de TM1:
1. Seleccione en los menús:
Archivo >Leer datos de Cognos >Leer datos de Cognos TM1
2. Conéctese al sistema de gestión del rendimiento de TM1.
3. Inicie sesión en el servidor TM1.
4. Seleccione un cubo TM1 y seleccione la vista que desea importar.
De forma opcional, puede alterar temporalmente los nombres predeterminados de las variables de SPSS
Statistics que se han creado a partir de los nombres de las dimensiones y mediciones de TM1.
Sistema PM
El URL del sistema de gestión del rendimiento que contiene el servidor TM1 al cual desea
conectarse. El sistema de gestión del rendimiento se define como un URL único para todos los
24 Guía del usuario de IBM SPSS Statistics 23 Core System
servidores TM1. Desde este URL, todos los servidores TM1 que se han instalado y que se están
ejecutando en el entorno se pueden descubrir y están accesibles. Especifique el URL y pulse
Conectar.
Servidor TM1
Cuando se establece la conexión con el sistema de gestión del rendimiento, seleccione el servidor
que contiene los datos que desea importar y pulse Iniciar sesión. Si no se ha conectado
previamente a este servidor, se le solicita que inicie la sesión.
Nombre de usuario y contraseña
Seleccione esta opción para iniciar sesión con un nombre de usuario y contraseña
especificados. Si el servidor utiliza el modo de autenticación 5 (seguridad de IBM
Cognos), seleccione el espacio de nombres que identifica el proveedor de autenticación de
seguridad en la lista disponible.
Credencial almacenada
Seleccione esta opción para utilizar la información de inicio de sesión de una credencial
almacenada. Para utilizar una credencial almacenada, debe estar conectado al IBM SPSS
Collaboration and Deployment Services Repository que contiene la credencial. Una vez
que esté conectado al repositorio, pulse Examinar para ver la lista de credenciales
disponibles.
Seleccione una vista de cubo de TM1 para importar.
Lista los nombres de los cubos dentro del servidor TM1 desde el cual puede importar datos.
Pulse dos veces un cubo para mostrar una lista de los vistas que puede importar. Seleccione una
vista y pulse la flecha hacia la derecha para moverla al campo Vista que va a importar.
Dimensiones de columna
Lista los nombres de las dimensiones de columna en la vista seleccionada.
Dimensiones de fila
Lista los nombres de las dimensiones de fila en la vista seleccionada.
Dimensiones de contexto
Lista los nombres de las dimensiones de contexto en la vista seleccionada.
Nota:
vCuando se importan datos, se crea una variable separada de SPSS Statistics para cada dimensión
regular y para cada elemento de la dimensión de medida.
vLas casillas vacías y las casillas con un valor de cero en TM1 se convierten al valor que falta en el
sistema.
vLas casillas con valores de cadena que no se pueden convertir a un valor numérico se convierten al
valor que falta del sistema.
Cambio de nombres de variable
De forma predeterminada, los nombres válidos de variable de IBM SPSS Statistics se generan
automáticamente a partir de los nombres de dimensión y los nombres de elementos en la dimensión de
medida desde la vista de cubo de IBM Cognos TM1 seleccionada. Puede utilizar la pestaña Campos del
diálogo Importar de TM1 para alterar temporalmente los nombres predeterminados. Los nombres deben
ser exclusivos y cumplir las reglas de nombres de variable. Consulte el tema para obtener más
información.
Lectura de datos de IBM SPSS Data Collection
En sistemas operativos de Microsoft Windows, puede leer los datos de productos IBM SPSS Data
Collection. Note: esta característica sólo está disponible si se ha instalado IBM SPSS Statistics en un
sistema operativo Microsoft Windows.
Capítulo 3. Archivos de datos 25
Para leer los orígenes de datos de IBM SPSS Data Collection, debe tener instalados los siguientes
elementos:
v.NET framework. Para obtener la versión más reciente de .NET framework, vaya a
http://www.microsoft.com/net.
vIBM SPSS Data Collection Survey Reporter Developer Kit. Está disponible una versión instalable de
IBM SPSS Data Collection Survey Reporter Developer Kit con el soporte de instalación.
Sólo puede añadir orígenes de datos de IBM SPSS Data Collection en el análisis en modo local. Esta
característica no está disponible en el análisis en modo distribuido con el servidor de IBM SPSS Statistics.
Para leer datos de un origen de datos de IBM SPSS Data Collection:
1. En cualquiera de las ventanas de IBM SPSS Statistics abiertas, elija en los menús:
Archivo >Abrir datos de IBM SPSS Data Collection
2. En la pestaña Propiedades de enlace de datos: Conexión, especifique el archivo de metadatos, el tipo
de datos de casos y el archivo de datos de casos.
3. Pulse en Aceptar.
4. En el cuadro de diálogo Importación de datos de IBM SPSS Data Collection, seleccione las variables
que desea incluir y seleccione cualquier criterio de selección de casos.
5. Pulse en Aceptar para leer los datos.
Pestaña Propiedades de enlace de datos: Conexión
Para leer un origen de datos de IBM SPSS Data Collection, debe especificar:
Ubicación de metadatos. El archivo del documento de metadatos (.mdd) que contiene la información de
definición del cuestionario.
Tipo de datos de casos. El formato del archivo de datos de casos. Los formatos disponibles incluyen:
vArchivo de datos de Quancept (DRS). Datos del caso en un archivo Quancept .drs,.drz o.dru.
vBase de datos de Quanvert. Datos del caso en una base de datos de Quanvert.
vBase de datos de IBM SPSS Data Collection (MS SQL Server). Datos de casos en una base de datos
relacional de investigación de mercado en SQL Server.
vArchivo de datos XML de IBM SPSS Data Collection. Datos de casos en un archivo XML.
Ubicación de datos de casos. El archivo que contiene los datos de casos. El formato de este archivo debe
ser coherente con el tipo de datos de casos seleccionado.
Nota: no se sabe hasta qué punto el resto de opciones de la pestaña Conexión o cualquier opción del resto
de pestañas Propiedades de enlace de datos pueden afectar a la lectura de datos de IBM SPSS Data
Collection en IBM SPSS Statistics, por lo que se recomienda no cambiar ninguna de ellas.
Pestaña Seleccionar variables
Puede seleccionar un subconjunto de variables que se van a leer. De forma predeterminada, todas las
variables estándar del origen de datos se muestran y aparecen seleccionadas.
vMostrar variables del sistema. Muestra cualquier variable "de sistema", incluidas las variables que
indican el estado de encuesta (en curso,finalizada,fecha de finalización, etc.). A continuación, puede
seleccionar cualquier variable de sistema que desee incluir. De forma predeterminada, se excluyen
todas las variables del sistema.
vMostrar variables de códigos. Muestra cualquier variable que represente códigos que se utilizan para
respuestas "Otros" abiertas para variables categóricas. A continuación, puede seleccionar cualquier
variable de códigos que desee incluir. De forma predeterminada, se excluyen todas las variables de
códigos.
26 Guía del usuario de IBM SPSS Statistics 23 Core System
vMostrar variables de archivo de origen. Muestra cualquier variable que contenga nombres de archivo
de imágenes de respuestas exploradas. A continuación, puede seleccionar cualquier variable de archivo
de origen que desee incluir. De forma predeterminada, todas las variables de archivo de origen están
excluidas.
Pestaña Selección de casos
Para los orígenes de datos de IBM SPSS Data Collection que contienen variables del sistema, puede
seleccionar casos basados en algunos criterios de variable de sistema. No es necesario incluir las variables
del sistema correspondientes en la lista de variables que se van a leer, pero las variables del sistema
necesarias deben existir en los datos de origen para aplicar los criterios de selección. Si las variables del
sistema necesarias no existen en los datos de origen, se ignorarán los criterios de selección
correspondientes.
Estado de recopilación de datos. Puede seleccionar datos de encuestados, datos de prueba o ambos.
También puede seleccionar casos basados en cualquier combinación de los siguientes parámetros de
estado de encuesta:
vFinalizada correctamente
vActiva/en curso
vTiempo agotado
vDetenida por un script
vDetenida por encuestado
vCierre del sistema de encuestas
vSeñal (terminado por una sentencia señalizadora en el script)
Fecha de finalización de la recopilación de datos. Puede seleccionar casos basados en la fecha de
finalización de la recopilación de datos.
vFecha de inicio. Se incluyen los casos para los que se completó la recopilación de datos durante o
después de la fecha especificada.
vFecha de finalización. Se incluyen los casos para los que se completó la recopilación de datos antes de
la fecha especificada. No se incluyen los casos para los que la recopilación de datos se completó en la
fecha de finalización.
vSi especifica tanto una fecha de inicio como una fecha de finalización, se definirá un rango de fechas
de finalización desde la fecha de inicio hasta la fecha de finalización (ésta última no incluida).
Información sobre el archivo
Un archivo de datos contiene mucho más que datos en bruto. También contiene información sobre la
definición de las variables, incluyendo:
vNombres de variable
vLos formatos de las variables
vLas etiquetas descriptivas de variable y de valor
Esta información se almacena en la parte del diccionario sobre el archivo de datos. El Editor de datos
proporciona una forma de presentar la información sobre la definición de la variable. También se puede
mostrar la información completa del diccionario para el conjunto de datos activo o para cualquier otro
archivo de datos.
Para mostrar información sobre los archivos de datos
1. Seleccione en los menús de la ventana Editor de datos:
Archivo >Mostrar información del archivo de datos
2. Para el archivo de datos abierto actualmente, elija Archivo de trabajo.
3. Para otros archivos de datos, elija Archivo externo y seleccione el archivo de datos.
Capítulo 3. Archivos de datos 27
La información sobre el archivo de datos se muestra en el Visor.
Almacenamiento de archivos de datos
Además de guardar los archivos de datos en formato de IBM SPSS Statistics, también puede guardarlos
en una amplia variedad de formatos externos, entre ellos:
vExcel y otros formatos de hoja de cálculo
vArchivos de texto delimitado por tabuladores y CSV
vSAS
vStata
vTablas de base de datos
Para guardar archivos de datos modificados
1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).
2. Elija en los menús:
Archivo >Guardar
El archivo de datos modificado se guarda y sobrescribe la versión anterior del archivo.
Guardar archivos de datos en la codificación de caracteres de la
página de códigos
Las versiones de IBM SPSS Statistics anteriores a la versión 16.0 no pueden leer los archivos de datos
Unicode. En el modo Unicode, para guardar un archivo de datos en la codificación de caracteres de la
página de códigos.
1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).
2. Desde los menús, elija:
Archivo >Guardar como
3. En la lista desplegable Guardar como tipo en el diálogo Guardar datos, seleccione Codificación local
de SPSS Statistics.
4. Especifique un nombre para el archivo de datos nuevo.
El archivo de datos modificado se guarda en la codificación de caracteres de la página de códigos del
entorno local actual. Esta acción no tiene ningún efecto sobre el conjunto de datos activo. La codificación
del conjunto de datos activo no se modifica. Guardar un archivo en la codificación de caracteres de la
página de códigos es similar a guardar un archivo en un formato externo como, por ejemplo, texto
delimitado por tabuladores o Excel.
Almacenamiento de archivos de datos en formatos externos
1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).
2. Elija en los menús:
Archivo >Guardar como...
3. Seleccione un tipo de archivo de la lista desplegable.
4. Introduzca un nombre de archivo para el nuevo archivo de datos.
Para escribir nombres de variable en la primera fila de una hoja de cálculo o de un archivo de datos
delimitados por tabuladores:
1. Pulse en Escribir nombres de variable en hoja de cálculo en el cuadro de diálogo Guardar datos
como.
Para guardar las etiquetas de valor en lugar de los valores de los datos en archivos Excel:
28 Guía del usuario de IBM SPSS Statistics 23 Core System
1. Pulse en Guardar etiquetas de valor donde se hayan definido en vez de valores de datos en el
cuadro de diálogo Guardar datos como.
Para guardar etiquetas de valor en un archivo de sintaxis de SAS (esta opción sólo está activa si se ha
seleccionado un tipo de archivo de SAS):
1. Pulse en Guardar etiquetas de valor en un archivo .sas en el cuadro de diálogo Guardar datos como.
Para obtener información sobre la exportación de datos en tablas de base de datos, consulte “Exportación
a base de datos” en la página 35.
Almacenamiento de datos: tipos de archivos de datos
Puede guardar datos en los siguientes formatos:
SPSS Statistics (*.sav). Formato de IBM SPSS Statistics.
vLos archivos de datos guardados con formato IBM SPSS Statistics no se pueden leer en versiones
anteriores a la 7.5. Los archivos de datos guardados en codificación Unicode no se pueden leer en
versiones de IBM SPSS Statistics anteriores a la 16.0.
vAl utilizar archivos de datos con nombres de variable con longitud superior a ocho bytes en 10.x u
11.x, se utilizan versiones exclusivas de ocho bytes de los nombres de variable, pero se mantienen los
nombres originales de las variables para su utilización en la versión 12.0 o posterior. En versiones
anteriores a la 10.0, los nombres largos originales de las variables se pierden si se guarda el archivo de
datos.
vAl utilizar archivos de datos con variables de cadena con más de 255 bytes en versiones anteriores a la
versión 13.0, dichas variables de cadena se fragmentan en variables de cadena de 255 bytes.
SPSS Statistics comprimido (*.zsav). Formato de IBM SPSS Statistics comprimido.
vLos archivos ZSAV tienen las mismas características que los archivos SAV, pero ocupan menos espacio
en disco.
vLos archivos ZSAV pueden tardar más o menos tiempo en abrirse y cerrarse, dependiendo del tamaño
de archivo y de la configuración del sistema. Se necesita más tiempo para descomprimir y comprimir
archivos ZSAV. Sin embargo, como los archivos ZSAV ocupan menos espacio en disco, reducen el
tiempo necesario para leer y escribir en disco. A medida que el tamaño del archivo aumenta, este
ahorro de tiempo sobrepasa el tiempo adicional necesario para descomprimir y comprimir los archivos.
vSolo IBM SPSS Statistics versión 21 o posterior puede abrir archivos ZSAV.
vLa opción para guardar el archivo de datos con su codificación de página de código local no está
disponible en archivos ZSAV. Estos archivos siempre se guardan en codificación UTF-8.
Codificación local de SPSS Statistics (*.sav). En el modo Unicode, esta opción guarda el archivo de
datos en la codificación de caracteres de la página de códigos del entorno local. Esta opción no está
disponible en el modo de página de códigos.
SPSS 7.0 (*.sav). Formato de la versión 7.0. Los archivos de datos guardados con formato de la versión
7.0 se pueden leer en la versión 7.0 y en versiones anteriores, pero no incluyen los conjuntos de
respuestas múltiples definidos ni la información sobre la introducción de datos para Windows.
SPSS/PC+ (*.sys). Formato SPSS/PC+. Si el archivo de datos contiene más de 500 variables, sólo se
guardarán las 500 primeras. Para las variables con más de un valor perdido del usuario, los valores
perdidos del usuario adicionales se recodificarán en el primero de estos valores. Este formato sólo está
disponible en los sistemas operativos Windows.
Portátil (*.por). El formato portátil puede leerse en otras versiones de IBM SPSS Statistics y en versiones
para otros sistemas operativos. Los nombres de variable se limitan a ocho bytes, y se convertirán a
nombres exclusivos de ocho bytes si es preciso. En la mayoría de los casos, ya no es necesario guardar los
datos en formato portátil, ya que los archivos de datos en formato IBM SPSS Statistics deberían ser
Capítulo 3. Archivos de datos 29
independientes de la plataforma y del sistema operativo. No se puede guardar los archivos de datos en
un archivo portátil en modo Unicode. Consulte el tema “Opciones generales” en la página 217 para
obtener más información.
Delimitado con tabuladores (*.dat). Archivos de texto con valores separados por tabuladores. (Nota: Los
tabuladores incrustados en los valores de cadena se conservarán como tabuladores en el archivo
delimitado por tabuladores. No se realiza ninguna distinción entre los tabuladores incrustados en los
valores y los tabuladores que separan los valores). Puede guardar archivos en Unicode o en codificación
de página de código local.
Delimitado por comas (*.csv). Archivos de texto con valores separados por comas o puntos y coma. Si el
indicador decimal actual de IBM SPSS Statistics es un punto, los valores se separan mediante comas. Si el
indicador decimal actual es una coma, los valores se separan mediante punto y coma. Puede guardar
archivos en Unicode o en codificación de página de código local.
ASCII fijo (*.dat). Archivos de texto con formato fijo, utilizando los formatos de escritura
predeterminados para todas las variables. No existen tabuladores ni espacios entre los campos de
variable. Puede guardar archivos en Unicode o en codificación de página de código local.
Excel 2007 (*.xlsx). Libro de trabajo con formato XLSX de Microsoft Excel 2007. El número máximo de
variables es 16.000, el resto de variables adicionales por encima de esa cifra se eliminan. Si el conjunto de
datos contiene más de un millón de casos, se crean varias hojas en el libro de trabajo.
Excel de 97 a 2003 (*.xls). Libro de trabajo de Microsoft Excel 97. El número máximo de variables es 256,
el resto de variables adicionales por encima de esa cifra se eliminan. Si el conjunto de datos contiene más
de 65.356 casos, se crean varias hojas en el libro de trabajo.
Excel 2.1 (*.xls). Archivo de hoja de cálculo de Microsoft Excel 2,1. El número máximo de variables es de
256 y el número máximo de filas es de 16,384.
1-2-3 Release 3.0 (*.wk3). Archivo de hoja de cálculo de Lotus 1-2-3, versión 3.0. El número máximo de
variables que puede guardar es 256.
1-2-3 Release 2.0 (*.wk1). Archivo de hoja de cálculo de Lotus 1-2-3, versión 2.0. El número máximo de
variables que puede guardar es 256.
1-2-3 Release 1.0 (*.wks). Archivo de hoja de cálculo de Lotus 1-2-3, versión 1A. El número máximo de
variables que puede guardar es 256.
SYLK (*.slk). Formato de enlace simbólico para archivos de hojas de cálculo de Microsoft Excel y de
Multiplan. El número máximo de variables que puede guardar es 256.
dBASE IV (*.dbf). Formato dBASE IV.
dBASE III (*.dbf). Formato dBASE III.
dBASE II (*.dbf). Formato dBASE II.
SAS v9+ Windows (*.sas7bdat). Versiones 9 de SAS para Windows. Puede guardar archivos en Unicode
(UTF-8) o en codificación de página de código local.
SAS v9+ UNIX (*.sas7bdat). Versiones 9 de SAS para UNIX. Puede guardar archivos en Unicode (UTF-8)
o en codificación de página de código local.
Extensión corta de Windows v7-8 de SAS (*.sd7). Versiones 7-8 de SAS para Windows con formato de
nombre de archivo corto.
30 Guía del usuario de IBM SPSS Statistics 23 Core System
Extensión larga de Windows v7-8 de SAS (*.sas7bdat). Versiones 7-8 de SAS para Windows con formato
de nombre de archivo largo.
SAS v7-8 para UNIX (*.sas7bdat). SAS v8 para UNIX.
SAS v6 para Windows (*.sd2). Formato de archivo de SAS v6 para Windows/OS2.
SAS v6 para UNIX (*.ssd01). Formato de archivo de SAS v6 para UNIX (Sun, HP, IBM).
SAS v6 para Alpha/OSF (*.ssd04). Formato de archivo de SAS v6 para Alpha/OSF (DEC UNIX).
Transporte de SAS (*.xpt). Archivo de transporte de SAS.
Stata Versión 13 Intercooled (*.dta).
Stata Versión 13 SE (*.dta).
Stata Versión 12 Intercooled (*.dta).
Stata Versión 12 SE (*.dta).
Stata Versión 11 Intercooled (*.dta).
Stata Versión 11 SE (*.dta).
Stata Versión 10 Intercooled (*.dta).
Stata Versión 10 SE (*.dta).
Stata Versión 9 Intercooled (*.dta).
Stata Versión 9 SE (*.dta).
Stata Versión 8 Intercooled (*.dta).
Stata Versión 8 SE (*.dta).
Stata Versión 7 Intercooled (*.dta).
Stata Versión 7 SE (*.dta).
Stata Versión 6 (*.dta).
Stata Versiones 4–5 (*.dta).
Nota: los nombres de los archivos de datos SAS pueden tener hasta 32 caracteres de longitud. No se
permiten espacios en blanco ni caracteres no alfanuméricos distintos del subrayado ("_"), y los nombres
deben empezar por una letra o un subrayado, tras los cuales pueden aparecer números.
Opciones de almacenamiento de archivos
En los archivos de hoja de cálculo, los delimitados por tabuladores y los delimitados por coma, se
pueden escribir nombres de variable en la primera fila del archivo.
Almacenamiento de archivos de datos en formato de Excel
Puede guardar los datos en uno de los tres formatos de archivo de Microsoft Excel. Excel 2.1, Excel 97 y
Excel 2007.
Capítulo 3. Archivos de datos 31
vExcel 2.1 y Excel 97 tienen un límite de 256 columnas; por lo tanto, sólo se incluyen las primeras 256
variables.
vExcel 2007 tiene un límite de 16.000 columnas; por lo tanto, sólo se incluyen las primeras 16.000
variables.
vExcel 2,1 tiene un límite de 16.384 filas; por lo tanto, sólo se incluyen los primeros 16.384 casos.
vExcel 97 y Excel 2007 tienen un número limitado de filas por hoja, pero como los libros de trabajo
pueden tener múltiples hojas, se crean más cuando se excede el máximo de cada hoja.
Tipos de variables
La siguiente tabla muestra la relación del tipo de las variables entre los datos originales de IBM SPSS
Statistics y los datos exportados a Excel.
Tabla 2. Cómo se correlacionan los datos de Excel con los formatos y tipos de variable de IBM SPSS Statistics
IBM SPSS Statistics Tipo de variable Formato de datos de Excel
Numérico 0.00; #,##0.00; ...
Coma 0.00; #,##0.00; ...
Dólar $#,##0_); ...
Fecha d-mmm-aaaa
Hora hh:mm:ss
Cadena General
Almacenamiento de archivos de datos en formato SAS
Al guardar un archivo de SAS, se aplica un tratamiento especial a determinadas características de los
datos. Entre estos casos se incluyen:
vAlgunos caracteres que se permiten en los nombres de variables de IBM SPSS Statistics no son válidos
en SAS, como por ejemplo @,#y$.Alexportar los datos, estos caracteres no válidos se reemplazan
por un carácter de subrayado.
vLos nombres de variable de IBM SPSS Statistics que contienen caracteres de varios bytes (por ejemplo,
caracteres japoneses o chinos) se convierten en nombres de variable con formato general Vnnn,
dondennn es un valor entero.
vLas etiquetas de variable de IBM SPSS Statistics que contienen más de 40 caracteres se truncan al
exportarlas a un archivo de SAS v6.
vSi existen, las etiquetas de variable de IBM SPSS Statistics se correlacionan con etiquetas de variable de
SAS. Si no hay ninguna etiqueta de variable en los datos de IBM SPSS Statistics, el nombre de variable
se correlaciona con la etiqueta de variable de SAS.
vSAS sólo permite que exista un valor perdido del sistema, mientras que IBM SPSS Statistics permite
que haya varios valores perdidos del usuario y del sistema. Por tanto, todos los valores perdidos del
usuario en IBM SPSS Statistics se correlacionan con un único valor perdido del sistema en el archivo
SAS.
vLos archivos de datos SAS 6-8 se guardará en la codificación basada en el entorno local actual de IBM
SPSS Statistics, con independencia del modo actual (Unicode o página de código). En modo Unicode,
los archivos SAS 9 se guardan en formato UTF-8. En modo de página de código, los archivos SAS 9 se
guardan en la codificación del entorno local actual.
vSe pueden guardar un máximo de 32.767 variables en SAS 6-8.
vLos nombres de los archivos de datos SAS pueden tener hasta 32 caracteres de longitud. No se
permiten espacios en blanco ni caracteres no alfanuméricos distintos del subrayado ("_"), y los nombres
deben empezar por una letra o un subrayado, tras los cuales pueden aparecer números.
Almacenamiento de etiquetas de valor
32 Guía del usuario de IBM SPSS Statistics 23 Core System
Existe la posibilidad de guardar los valores y las etiquetas de valor asociadas al archivo de datos en un
archivo de sintaxis de SAS. Este archivo de sintaxis contiene comandos proc format yproc datasets que
se puede ejecutar en SAS para crear un archivo de catálogo de formato SAS.
Esta característica no se admite para el archivo de transporte de SAS.
Tipos de variables
La siguiente tabla muestra la relación del tipo de las variables entre los datos originales de IBM SPSS
Statistics y los datos exportados a SAS.
Tabla 3. Cómo se correlacionan los formatos y tipos de variables SAS con los formatos y tipos de IBM SPSS
Statistics
IBM SPSS Statistics Tipo de variable Tipo de variable de SAS Formato de datos de SAS
Numérico Numérico 12
Coma Numérico 12
Puntos Numérico 12
Notación científica Numérico 12
Fecha Numérico (Fecha) p.ej., MMDDAA10,...
Fecha (Hora) Numérico Hora18
Dólar Numérico 12
Moneda personalizada Numérico 12
Cadena Carácter $8
Almacenamiento de archivos de datos en formato Stata
vLos datos se pueden escribir en formato Stata 5–13 y en formatoIntercooled y SE (versión 7 o
posterior).
vLos archivos de datos que se guardan en formato Stata 5 se pueden leer con Stata 4.
vLos primeros 80 bytes de etiquetas de variable se guardan como etiquetas de variable Stata.
vPara Stata releases 4-8, los primeros 80 bytes de etiquetas de valor para variables numéricas se guardan
como etiquetas de valor Stata. Para Stata release 9 o posterior, se guardan las etiquetas de valor
completas para variables numéricas. Las etiquetas de valor se excluyen para variables de cadena,
valores numéricos no enteros y valores numéricos mayores que un valor absoluto de 2.147.483.647.
vPara las versiones 7 y posteriores, los primeros 32 bytes de nombres de variable en un formato que
distingue entre mayúsculas y minúsculas se guardan como nombres de variable Stata. Para versiones
anteriores, los primeros ocho bytes de nombres de variable se guardan como nombres de variable
Stata. Cualquier carácter distinto de letras, número y caracteres de subrayado se convierten en
caracteres de subrayado.
vLos nombres de variable de IBM SPSS Statistics que contienen caracteres de varios bytes (por ejemplo,
caracteres japoneses o chinos) se convierten en nombres de variables con formato general Vnnn,
dondennn es un valor entero.
vPara las versiones 5–6 y las versiones de Intercooled 7 y posteriores, los 80 primeros bytes de los
valores de cadena se guardan. Para Stata SE 7–12, los primeros 244 bytes de valores de cadena se
guardan. Para Stata SE 13 o posteriores, se guardan los valores de cadena completos,
independientemente de la longitud.
vPara las versiones 5–6 y las versiones de Intercooled 7 y posteriores, solo se guardan las primeras 2.047
variables. Para Stata SE 7 o posteriores, solo se guardan las primeras 32.767 variables.
Capítulo 3. Archivos de datos 33
Tabla 4. Cómo se correlaciona el formato y tipo de variable de Stata con el formato y tipo de IBM SPSS Statistics
IBM SPSS Statistics Tipo de
variable
Tipo de variable Stata Formato de datos Stata
Numérico Numérico g
Coma Numérico g
Puntos Numérico g
Notación científica Numérico g
Date*, Momento_fecha Numérico D_m_Y
Tiempo, Tiempo_fecha Numérico g (número de segundos)
Dia_semana Numérico g (1–7)
Mes Numérico g (1–12)
Dólar Numérico g
Moneda personalizada Numérico g
Cadena Cadena s
*Date, Adate, Edate, SDate, Jdate, Qyr, Moyr, Wkyr
Almacenamiento de subconjuntos de variables
El cuadro de diálogo Guardar datos como: Variables permite seleccionar las variables que desea guardar
en el nuevo archivo de datos. De forma predeterminada, se almacenarán todas las variables. Anule la
selección de las variables que no desea guardar o pulse en Eliminar todo y, a continuación, seleccione
aquellas variables que desea guardar.
Sólo visibles. Selecciona sólo variables de conjuntos de variables que se usan actualmente. Consulte el
tema “Uso de conjuntos de variables para mostrar y ocultar variables” en la página 206 para obtener más
información.
Para guardar un subconjunto de variables
1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).
2. Elija en los menús:
Archivo >Guardar como...
3. Pulse en Variables.
4. Seleccione las variables que desee almacenar.
Cifrado de archivos de datos
Puede proteger información confidencial guardada en un archivo de datos cifrando el archivo con una
contraseña. Una vez cifrado, el archivo solo se puede abrir con la contraseña.
1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).
2. Elija en los menús:
Archivo >Guardar como...
3. Seleccione Cifrar archivo con contraseña en el cuadro de diálogo Guardar datos como.
4. Pulse en Guardar.
5. En el cuadro de diálogo Cifrar archivo, introduzca una contraseña y vuelva a introducirla en el
cuadro de texto Confirmar contraseña. Las contraseñas están limitadas a 10 caracteres y distinguen
entre mayúsculas y minúsculas.
34 Guía del usuario de IBM SPSS Statistics 23 Core System
Advertencia: si pierde las contraseñas, no podrá recuperarlas. Si se pierde la contraseña, no podrá abrir el
archivo.
Creación de contraseñas seguras
vUtilice ocho o más caracteres.
vIncluya números, símbolos e incluso signos de puntuación en su contraseña.
vEvite secuencias de números o caracteres como, por ejemplo, "123" y"abc", así como repeticiones; por
ejemplo, "111aaa".
vNo cree contraseñas que contengan información personal como, por ejemplo, fechas de cumpleaños o
apodos.
vCambie periódicamente la contraseña.
Nota: no se permite guardar los archivos cifrados en un IBM SPSS Collaboration and Deployment
Services Repository.
Modificación de archivos cifrados
vSi abre un archivo cifrado, realice las modificaciones y seleccione Archivo > Guardar; el archivo
modificado se guardará con la misma contraseña.
vPuede cambiar la contraseña en un archivo cifrado abriendo el archivo, repita el procedimiento para
cifrarlo y especifique una contraseña diferente en el cuadro de diálogo Cifrar archivo.
vPuede guardar una versión no cifrada de un archivo cifrado abriendo el archivo, seleccionando Archivo
> Guardar como y cancelando la selección de Cifrar archivo con contraseña en el cuadro de diálogo
Guardar datos como.
Nota: Los archivos de datos y los documentos de resultado cifrados no se pueden abrir en versiones de
IBM SPSS Statistics anteriores a la versión 21. Los archivos de sintaxis cifrados no se pueden abrir en
versiones anteriores a la versión 22.
Exportación a base de datos
El Asistente para la exportación a base de datos permite:
vReemplazar los valores de los campos (columnas) de la tabla de la base de datos existente o añadir
nuevos campos a una tabla.
vAñadir nuevos registros (filas) a una tabla de base de datos.
vReemplazar completamente una tabla de base de datos o crear una tabla nueva.
Para exportar datos a una base de datos:
1. En los menús de la ventana del Editor de datos correspondientes al conjunto de datos que contiene
los datos que se desean exportar, seleccione:
Archivo >Exportar a base de datos
2. Seleccione el origen de base de datos.
3. Siga las instrucciones del asistente para exportación para exportar los datos.
Creación de campos de base de datos a partir de variables de IBM SPSS Statistics
Al crear nuevos campos (añadiendo campos a una tabla de base de datos existente, creando una tabla
nueva o reemplazando una tabla), puede especificar los nombres de campo, el tipo de datos y el ancho
(donde corresponda).
Nombre de campo. Los nombres de campo predeterminados son los mismos que los nombres de variable
de IBM SPSS Statistics. Puede cambiar los nombres de campo a cualquier nombre permitido por el
formato de la base de datos. Por ejemplo, muchas bases de datos admiten que los nombres de los campos
Capítulo 3. Archivos de datos 35
contengan caracteres que no se permiten en los nombres de variable, incluidos los espacios. Por tanto, un
nombre de variable como LlamadaEspera puede cambiarse a un nombre de campo Llamada en espera.
Tipo. El asistente para la exportación realiza las asignaciones iniciales de los tipos de datos según los
tipos de datos ODBC estándar o los tipos de datos admitidos por el formato de la base de datos
seleccionada que más se parezca al formato de datos IBM SPSS Statistics definido. No obstante, las bases
de datos puede realizar distinciones de tipos que no tenga equivalente directo en IBM SPSS Statistics y
viceversa. Por ejemplo, la mayoría de los valores numéricos de IBM SPSS Statistics se almacenan como
valores en punto flotante con doble precisión, mientras que los tipos de datos numéricos de las bases de
datos incluyen números flotantes (doble), enteros, reales, etc. Además, muchas bases de datos no tienen
equivalentes a los formatos de tiempo de IBM SPSS Statistics. Puede cambiar el tipo de datos a cualquiera
de los disponibles en la lista desplegable.
Como norma general, el tipo de datos básico (de cadena o numéricos) de la variable debe coincidir con el
tipo de datos básico del campo de la base de datos. Si existe alguna discrepancia de tipo de datos que la
base de datos no pueda resolver, se producirá un error y los datos no se exportarán a la base de datos.
Por ejemplo, si exporta una variable de cadena a un campo de la base de datos con un tipo de datos
numérico, se producirá un error si algún valor de la variable de cadena contiene caracteres no numéricos.
Amplitud. Puede cambiar el ancho definido de los tipos de campo de cadena (char, varchar). Los anchos
de campo numérico se definen por el tipo de datos.
De forma predeterminada, los formatos de las variables de IBM SPSS Statistics se correlacionan con tipos
de campo de la base de datos en función del siguiente esquema general. Los tipos de campo de la base
de datos reales pueden variar dependiendo de la base de datos.
Tabla 5. Conversión de formato para bases de datos
Formatos de las variables IBM SPSS Statistics Tipo de campo de la base de datos
Numérico Flotante o doble
Coma Flotante o doble
Puntos Flotante o doble
Notación científica Flotante o doble
Fecha Fecha o Momento_fecha o marca de hora
Momento_fecha Momento_fecha o marca de hora
Tiempo, Tiempo_fecha Flotante o doble (número de segundos)
Dia_semana Entero (1–7)
Mes Entero (1–12)
Dólar Flotante o doble
Moneda personalizada Flotante o doble
Cadena Char or Varchar
Valores perdidos del usuario
Existen dos opciones para el tratamiento de los valores perdidos del usuario cuando los datos de las
variables se exportan a campos de bases de datos:
vExportar como valores válidos. Los valores perdidos del usuario se tratan como valores no perdidos,
válidos, regulares.
vExportar los valores perdidos del usuario numéricos como nulos y exportar los valores perdidos del
usuario de cadena como espacios en blanco. Los valores perdidos del usuario numéricos reciben el
mismo tratamiento que los valores perdidos del sistema. Los valores perdidos del usuario se convierten
en espacios en blanco (las cadenas no pueden ser valores perdidos del sistema).
36 Guía del usuario de IBM SPSS Statistics 23 Core System
Selección de un origen de datos
En el primer panel del Asistente para la exportación a base de datos, seleccione el origen de datos al que
desea exportar los datos.
Puede exportar datos a cualquier origen de base de datos para el que tenga el controlador ODBC
adecuado. (Nota: no se admite la exportación a orígenes de datos OLE DB).
Si no tiene configurado ningún origen de datos ODBC o si desea añadir uno nuevo, pulse en Añadir
origen de datos ODBC.
vEn los sistemas operativos Linux, este botón no está disponible. Los orígenes de datos ODBC se
especifican en odbc.ini y es necesario especificar las variables de entorno ODBCINI con la ubicación de
dicho archivo. Si desea obtener más información, consulte la documentación de los controladores de la
base de datos.
vEn el análisis en modo distribuido (disponible con IBM SPSS Statistics Server), este botón no está
disponible. Para añadir orígenes de datos en el análisis en modo distribuido, consulte con el
administrador del sistema.
Un origen de datos ODBC está compuesto por dos partes esenciales de información: el controlador que se
utilizará para acceder a los datos y la ubicación de la base de datos a la que se desea acceder. Para
especificar los orígenes de datos, deberán estar instalados los controladores adecuados. El soporte de
instalación incluye controladores de una gran variedad de formatos de base de datos .
Algunos orígenes de datos pueden requerir un ID de acceso y una contraseña antes de poder continuar
con el siguiente paso.
Selección del modo de exportar los datos
Una vez seleccionado el origen de datos, se indica la forma en la que se desean exportar los datos.
Las siguientes opciones están disponibles para exportar datos a una base de datos:
vReemplazar los valores de los campos existentes. Reemplaza los valores de los campos seleccionados
en una tabla existente con valores de las variables seleccionadas en el conjunto de datos activo.
Consulte el tema “Sustitución de los valores de los campos existentes” en la página 39 para obtener
más información.
vAñadir nuevos campos a una tabla existente. Crea nuevos campos en una tabla existente que contiene
los valores de las variables seleccionadas en el conjunto de datos activo. Consulte el tema “Adición de
nuevos campos” en la página 39 para obtener más información. Esta opción no está disponible para los
archivos de Excel.
vAñadir nuevos registros a una tabla existente. Añade nuevos registros (filas) a una tabla existente que
contiene los valores de los casos del conjunto de datos activo. Consulte el tema “Adición de nuevos
registros (casos)” en la página 39 para obtener más información.
vEliminar una tabla existente y crear una tabla nueva con el mismo nombre. Elimina la tabla
especificada y crea una nueva tabla con el mismo nombre que contiene variables seleccionadas del
conjunto de datos activo. Toda la información de la tabla original, incluidas las definiciones de las
propiedades del campo (como las claves primarias o los tipos de datos) se pierde. Consulte el tema
“Creación de una nueva tabla o sustitución de una tabla” en la página 40 para obtener más
información.
vCrear una tabla nueva. Crea una tabla nueva en la base de datos que contiene datos de las variables
seleccionadas en el conjunto de datos activo. El nombre puede ser cualquier valor que esté permitido
como nombre de tabla por el origen de datos. El nombre no puede coincidir con el nombre de una
tabla o vista existentes en la base de datos. Consulte el tema “Creación de una nueva tabla o
sustitución de una tabla” en la página 40 para obtener más información.
Capítulo 3. Archivos de datos 37
Selección de una tabla
Al modificar o reemplazar una tabla de la base de datos, es necesario seleccionar la tabla que desea
modificar o reemplazar. Este panel del Asistente para la exportación a bases de datos muestra una lista
de tablas y vistas de la base de datos seleccionada.
De forma predeterminada, la lista muestra sólo las tablas de bases de datos estándar. Puede controlar el
tipo de elementos que se muestran en la lista:
vTablas. Tablas de base de datos estándar.
vVistas. Las vistas son "tablas" virtuales o dinámicas definidas por consultas. Estas tablas pueden incluir
uniones de varias tablas y/o campos derivados de cálculos basados en los valores de otros campos.
Puede añadir registros o reemplazar valores de campos existentes en vistas, pero es posible que los
campos que se pueden modificar estén limitados dependiendo de cómo esté estructurada la vista. Por
ejemplo, no se puede modificar un campo derivado, añadir campos a una vista ni reemplazar una
vista.
vSinónimos. Un sinónimo es un alias para una tabla o vista que suele estar definido en una consulta.
vTablas del sistema. Las tablas del sistema definen propiedades de la base de datos. En algunos casos,
las tablas de base de datos estándar pueden estar clasificadas como tablas del sistema y sólo se
mostrarán si se selecciona esta opción. El acceso a tablas del sistema reales suele estar limitado a los
administradores de la base de datos.
Selección de casos para exportar
La selección de casos en el Asistente para la exportación a base de datos está limitada, bien a todos los
casos o a los casos seleccionados a través de una condición de filtrado definida previamente. Si no hay
ningún filtrado de casos activo, este panel no aparecerá y se exportarán todos los casos del conjunto de
datos activo.
Para obtener información sobre la definición de una condición de filtrado para la selección de casos,
consulte “Seleccionar casos” en la página 121.
Emparejamiento de casos con registros
Al añadir campos (columnas) a una tabla existente o reemplazar los valores de los campos existentes, es
necesario asegurarse de que cada caso (fila) del conjunto de datos activo coincide correctamente con el
correspondiente registro de la base de datos.
vEn la base de datos, el campo o conjunto de campos que identifica de forma exclusiva cada registro
suele estar designado como la clave primaria.
vDebe identificar las variables correspondientes a los campos de clave primaria u otros campos que
identifican de forma exclusiva cada registro.
vLos campos no tienen que ser la clave primaria de la base de datos, sin embargo, el valor de campo o
la combinación de los valores de campo deben ser exclusivos para cada caso.
Para casar las variables con los campos de la base de datos que identifican cada registro de forma
exclusiva:
1. arrastre y coloque las variables en los campos correspondientes de la base de datos.
o
2. Seleccione una variable de la lista de variables, seleccione el campo correspondiente en la tabla de la
base de datos y pulse en Conectar.
Para eliminar una línea de conexión:
3. Seleccione la línea de conexión y pulse la tecla Supr.
Nota: los nombres de variable y los nombres de los campos de la base de datos es posible que no sean
idénticos (ya que los nombres de la base de datos pueden contener caracteres que no admiten los
nombres de variable de IBM SPSS Statistics), pero si el conjunto de datos activo se creó a partir de la
38 Guía del usuario de IBM SPSS Statistics 23 Core System
tabla de base de datos que está modificando, los nombres de variable o las etiquetas de variable
normalmente serán como mínimo similares a los nombres de campo de la base de datos.
Sustitución de los valores de los campos existentes
Para reemplazar los valores de los campos existentes en una base de datos:
1. En el panel Seleccionar cómo exportar los datos del Asistente para la exportación a base de datos,
seleccione Reemplazar los valores de los campos existentes.
2. En el panel Seleccione una tabla o vista, seleccione la tabla de base de datos.
3. En el panel Casar casos con registros, case las variables que identifican de forma exclusiva cada caso
con los nombres de los campos de la base de datos correspondientes.
4. Para cada campo del que desee reemplazar los valores, arrastre la variable que contiene los nuevos
valores y colóquela en la columna Origen de valores, junto al nombre del campo de la base de datos
correspondiente.
vComo norma general, el tipo de datos básico (de cadena o numéricos) de la variable debe coincidir con
el tipo de datos básico del campo de la base de datos. Si existe alguna discordancia de tipos de datos
que la base de datos no pueda resolver, se producirá un error y no se exportará ningún dato a la base
de datos. Por ejemplo, si exporta una variable de cadena a un campo de la base de datos con un tipo
de datos numérico (por ejemplo, doble, real, entero), se producirá un error si algún valor de la variable
de cadena contiene caracteres no numéricos. La letra adel icono situado junto a una variable denota
una variable de cadena.
vNo se puede modificar el nombre, el tipo ni la anchura del campo. Los atributos del campo de la base
de datos originales se conservan, sólo se reemplazan los valores.
Adición de nuevos campos
Para añadir nuevos campos a una tabla de base de datos existente:
1. En el panel Seleccionar cómo exportar los datos del Asistente para la exportación a base de datos,
seleccione Añadir nuevos campos a una tabla existente.
2. En el panel Seleccione una tabla o vista, seleccione la tabla de base de datos.
3. En el panel Casar casos con registros, case las variables que identifican de forma exclusiva cada caso
con los nombres de los campos de la base de datos correspondientes.
4. Arrastre las variables que desea añadir como campos nuevos y colóquelas en la columna Origen de
valores.
Para obtener información sobre nombres de campo y tipos de datos, consulte la sección de creación de
campos de base de datos a partir de variables de IBM SPSS Statistics en “Exportación a base de datos” en
la página 35.
Mostrar los campos existentes. Seleccione esta opción para mostrar una lista de campos existentes. No
puede utilizar este panel en el Asistente para la exportación a base de datos para reemplazar campos
existentes, pero puede resultar útil saber los campos que ya están presentes en la tabla. Si desea sustituir
los valores de los campos existentes, consulte “Sustitución de los valores de los campos existentes”.
Adición de nuevos registros (casos)
Para añadir nuevos registros (caso) a una tabla de base de datos:
1. En el panel Seleccionar cómo exportar los datos del Asistente para la exportación a base de datos,
seleccione Añadir nuevos registros a una tabla existente.
2. En el panel Seleccione una tabla o vista, seleccione la tabla de base de datos.
3. Haga coincidir las variables del conjunto de datos activo con los campos de la tabla arrastrando las
variables y colocándolas en la columna Origen de valores.
El Asistente para la exportación a base de datos seleccionará automáticamente todas las variables que
coincidan con los campos existentes utilizando la información sobre la tabla de base de datos original
almacenada en el conjunto de datos activo (si está disponible) y/o los nombres de las variables que
Capítulo 3. Archivos de datos 39
coinciden con los nombres de campo. Este emparejamiento inicial automático sólo pretende ser una guía
y permite cambiar la forma en que se hacen coincidir variables con los campos de la base de datos.
Al añadir nuevos registros a una tabla existente, se aplican las siguientes reglas y limitaciones básicas:
vTodos los casos (o todos los casos seleccionados) en el conjunto de datos activo se añaden a la tabla. Si
alguno de estos casos duplica los registros existentes en la base de datos, puede producirse un error si
se encuentra un valor de clave duplicado. Para obtener información sobre cómo exportar sólo los casos
seleccionados, consulte “Selección de casos para exportar” en la página 38.
vPuede utilizar los valores de las variables nuevas creadas en la sesión como los valores de los campos
existentes, pero no puede añadir campos nuevos ni cambiar los nombres de los existentes. Para añadir
nuevos campos a una tabla de base de datos, consulte “Adición de nuevos campos” en la página 39.
vCualquier campo de la base de datos excluido que no coincida con una variable no tendrá ningún
valor para los registros añadidos a la tabla de base de datos. (Si la casilla Origen de valores está vacía,
no habrá ninguna variable que coincida con el campo.)
Creación de una nueva tabla o sustitución de una tabla
Para crear una tabla de base de datos nueva o reemplazar una tabla de base de datos existente:
1. En el panel Seleccionar cómo exportar los datos del asistente para la exportación, seleccione Eliminar
una tabla existente y crear una tabla nueva con el mismo nombre o seleccione Crear una tabla
nueva e introduzca un nombre para la nueva tabla. Si el nombre de la tabla contiene cualquier
carácter diferente a letras, números o un guión bajo, el nombre debe estar entre comillas dobles.
2. Si está reemplazando una tabla existente, en el panel Seleccione una tabla o vista, seleccione la tabla
de base de datos.
3. Arrastre las variables y colóquelas en la columna Variable para guardar.
4. Si lo desea, puede designar variables o campos que definan la clave primaria, cambiar nombres de
campos y cambiar el tipo de datos.
Clave primaria. Para designar variables como la clave primaria de la tabla de base de datos, marque la
casilla de la columna identificada con el icono de llave.
vTodos los valores de la clave primaria deben ser exclusivos, de lo contrario, se producirá un error.
vSi selecciona una única variable como la clave primaria, cada registro (caso) debe tener un valor
exclusivo para esa variable.
vSi selecciona varias variables como clave primaria, esto define una clave primaria compuesta y la
combinación de valores para las variables seleccionadas debe ser exclusiva para cada caso.
Para obtener información sobre nombres de campo y tipos de datos, consulte la sección de creación de
campos de base de datos a partir de variables de IBM SPSS Statistics en “Exportación a base de datos” en
la página 35.
Finalización del Asistente para la exportación a base de datos
El último paso del Asistente para la exportación a base de datos proporciona un resumen de las
especificaciones de exportación.
Resumen
vConjunto de datos. El nombre de la sesión de IBM SPSS Statistics para el conjunto de datos que se
utiliza para exportar datos. Esta información es útil principalmente si existen varios orígenes de datos
abiertos. Un origen de datos abierto con una sintaxis del mandato tiene un nombre de conjunto de
datos solo si se le ha asignado de forma explícita.
vTabla. El nombre de la tabla que se va a modificar o crear.
vCasos para exportar. Se exportan todos los casos o se exportan los casos que se han seleccionado con
una condición de filtro definida anteriormente.
vAcción. Indica cómo se modifica la base de datos (por ejemplo, crear una tablan nueva, añadir campos
o registros a una tabla existente).
40 Guía del usuario de IBM SPSS Statistics 23 Core System
vValores perdidos del usuario. Los valores perdidos del usuario se pueden exportar como valores
válidos o se pueden tratar como valores perdidos del sistema para las variables numéricas y
convertirlos en espacios en blanco para las variables de cadena. Este ajuste se controla en el panel en el
que se seleccionan las variables que se van a exportar.
Carga masiva
Carga masiva. Envía datos a la base de datos en lotes, en lugar de un registro a la vez. Esta acción puede
conseguir que la operación sea mucho más rápida, sobre todo, para archivos de datos grandes.
vTamaño de lote. Especifica el número de registros para enviar en cada lote.
vConfirmación de lote. Confirma los registros en la base de datos en el tamaño del lote especificado.
vEnlace ODBC. Utiliza el método de enlace ODBC para confirmar registros en el tamaño del lote
especificado. Esta opción solo está disponible si la base de datos soporta el enlace ODBC. Esta opción
no está disponible en Mac OS.
Enlaces por filas. Normalmente, el enlaces por filas mejora la velocidad en comparación con el uso
de inserciones parametrizadas que insertan datos registro a registro.
Enlace por columnas. El enlace por columnas mejora el rendimiento enlazando cada columna de
base de datos con una matriz de nvalores.
¿Qué desea hacer?
vExportar los datos. Exporta los datos a la base de datos.
vPegar la sintaxis. Pega la sintaxis del comando para exportar los datos a una ventana de sintaxis.
Puede modificar y guardar la sintaxis del comando pegada.
Exportación a IBM SPSS Data Collection
El cuadro de diálogo Exportar a IBM SPSS Data Collection crea archivos de datos IBM SPSS Statistics y
archivos de metadatos IBM SPSS Data Collection que puede utilizar para leer los datos en aplicaciones de
IBM SPSS Data Collection. Resulta particularmente útil cuando los datos van y vienen entre las
aplicaciones de IBM SPSS Statistics y IBM SPSS Data Collection.
Para exportar datos que se van a utilizar en aplicaciones de IBM SPSS Data Collection:
1. En los menús de la ventana del Editor de datos correspondientes al conjunto de datos que contiene
los datos que se desean exportar, seleccione:
Archivo >Exportar a IBM SPSS Data Collection
2. Pulse en Archivo de datos para especificar el nombre y la ubicación del archivo de datos IBM SPSS
Statistics.
3. Pulse en Archivo de metadatos para especificar el nombre y la ubicación del archivo de datos de IBM
SPSS Data Collection.
Para nuevas variables y conjuntos de datos no creados a partir de orígenes de datos de IBM SPSS Data
Collection, los atributos de variable de IBM SPSS Statistics se correlacionan con atributos de metadatos de
IBM SPSS Data Collectionen el archivo de metadatos siguiendo los métodos descritos en la
documentación de SAV DSC en la biblioteca de desarrollo de IBM SPSS Data Collection Developer
Library.
Si el conjunto de datos activo se ha creado a partir de un origen de datos de IBM SPSS Data Collection:
vEl nuevo archivo de metadatos se crea fusionando los atributos de metadatos originales con los
atributos de metadatos de todas las nuevas variables, además de todos los cambios realizados a las
variables originales que puedan afectar a sus atributos de metadatos (por ejemplo, adición o cambios
de las etiquetas de variable).
vPara las variables originales leídas del origen de datos de IBM SPSS Data Collection, todos los atributos
de metadatos no reconocidos por IBM SPSS Statistics se conservan en su estado original. Por ejemplo,
Capítulo 3. Archivos de datos 41
IBM SPSS Statistics convierte las variables de cuadrícula en variables de IBM SPSS Statistics normales,
pero los metadatos que definen dichas variables de cuadrículas se conservan al guardar el nuevo
archivo de metadatos.
vSi los nombres de todas las variables de IBM SPSS Data Collection se cambiaron automáticamente para
que cumpliesen las normas de denominación de variables de IBM SPSS Statistics, el archivo de
metadatos correlaciona los nombres convertidos con los nombres de variable originales de IBM SPSS
Data Collection.
La presencia o ausencia de etiquetas de valor puede afectar a los atributos de metadatos de las variables
y, por tanto, a la manera en que dichas variables son leídas por las aplicaciones de IBM SPSS Data
Collection. Si se han definido etiquetas de valor para algunos valores no perdidos de una variable,
deberán definirse para todos los valores no perdidos de dicha variable ya que, de no ser así, IBM SPSS
Data Collection eliminará los valores no etiquetados al leer el archivo de datos.
Esta característica sólo está disponible con IBM SPSS Statistics instalados en sistemas operativos Microsoft
Windows y sólo están disponibles en el modo de análisis local. Esta característica no está disponible en el
análisis en modo distribuido con el servidor de IBM SPSS Statistics.
Para escribir los archivos de metadatos de IBM SPSS Data Collection, debe tener instalados los siguientes
elementos:
v.NET framework. Para obtener la versión más reciente de .NET framework, vaya a
http://www.microsoft.com/net.
vIBM SPSS Data Collection Survey Reporter Developer Kit. Está disponible una versión instalable de
IBM SPSS Data Collection Survey Reporter Developer Kit con el soporte de instalación.
Exportación a Cognos TM1
Si tiene acceso a una base de datos de IBM Cognos TM1, puede exportar datos de IBM SPSS Statistics a
TM1. Esta característica es particularmente práctica cuando se importan datos de TM1, se transforman o
puntúan los datos en SPSS Statistics y se desea volver a exportar los resultados a TM1.
Importante: Para permitir el intercambio de datos entre SPSS Statistics y TM1, debe copiar los siguientes
tres prcoesos de SPSS Statistics al servidor TM1: ExportToSPSS.pro,ImportFromSPSS.pro,y
SPSSCreateNewMeasures.pro. Para añadir estos procesos al servidor TM1, debe copiarlos en el directorio
de datos del servidor TM1 y reiniciar el servidor TM1. Estos archivos están disponibles desde el
directorio common/scripts/TM1 en el directorio de instalación de SPSS Statistics.
Para exportar datos a TM1:
1. Seleccione en los menús:
Archivo >Exportar >Exportar aCognos TM1
2. Conéctese al sistema de gestión del rendimiento de TM1.
3. Inicie sesión en el servidor TM1.
4. Seleccione el cubo de TM1 donde desea exportar los datos.
5. Especifique las correlaciones de los campos del conjunto de datos activo con las dimensiones y las
mediciones del cubo de TM1.
Sistema PM
El URL del sistema de gestión del rendimiento que contiene el servidor TM1 al cual desea
conectarse. El sistema de gestión del rendimiento se define como un URL único para todos los
servidores TM1. Desde este URL, todos los servidores TM1 que se han instalado y que se están
ejecutando en el entorno se pueden descubrir y están accesibles. Especifique el URL y pulse
Conectar.
Servidor TM1
Cuando se establece la conexión con el sistema de gestión del rendimiento, seleccione el servidor
42 Guía del usuario de IBM SPSS Statistics 23 Core System
que contiene el cubo al que desea exportar los datos y pulse Iniciar sesión. Si no se ha conectado
previamente a este servidor, se le solicita que especifique el nombre de usuario y la contraseña. Si
el servidor utiliza el modo de autenticación 5 (seguridad de IBM Cognos), seleccione el espacio
de nombres que identifica el proveedor de autenticación de seguridad en la lista disponible.
Seleccione un cubo de TM1 para exportar
Lista los nombres de los cubos dentro del servidor TM1 al cual puede exportar datos. Seleccione
un cubo y pulse la flecha hacia la derecha para moverlo al campo Exportar a cubo.
Nota:
vEn la exportación se ignoran los valores que faltan del sistema y los valores que faltan del usuario de
campos que se han correlacionado con elementos en la medición y la dimensión del cubo de TM1. Las
casillas asociadas en el cubo de TM1 no se modifican.
vLos campos con un valor de cero, que se han correlacionado con elementos en la dimensión de
medida, se exportan como un valor válido.
Correlación de campos con dimensiones de TM1
Utilice la pestaña Correlación en el cuadro de diálogo Exportar a TM1 para correlacionar campso de SPSS
Statistics con las dimensiones y las mediciones asociadas de IBM Cognos TM1. Puede correlacionarse con
elementos existente en la dimensión de medida o puede crear elementos nuevos en la dimensión de
medida del cubo de TM1.
vPara cada dimensión regular del cubo de TM1 especificado, debe correlacionar un campo en el
conjunto de datos activo con la dimensión o especificar una porción de la dimensión. Una porción
especifica un elemento de una sola hoja de una dimensión, de forma que todos los casos exportados se
asocian al elemento de hoja especificado.
vPara un campo que está correlacionado con una dimensión regular, no se exportan los casos con
valores de campo que no coinciden con un elemento de hoja en la dimensión especificada. En este
sentido, solo puede exportar a elementos de hoja.
vSolo los campos de serie del conjunto de datos activo se pueden correlacionar con dimensiones
regulares. Solo los campos numéricos del conjunto de datos activo se pueden correlacionar con
elementos en la dimensión de medida del cubo.
vLos valores que se exportan a un elemento existente en la dimensión de medida sobrescriben las
casillas asociadas en el cubo de TM1.
Para correlacionar un campo de SPSS Statistics con una dimensión TM1 regular o con un elemento
existente en la dimensión de medida:
1. Seleccione el campo de SPSS Statistics en la lista Campos.
2. Seleccione la dimensión o medición de TM1 asociada en la lista Dimensiones de TM1.
3. Pulse Correlacionar.
Para correlacionar un campo de SPSS Statistics con un elemento nuevo en la dimensión de medida:
1. Seleccione el campo de SPSS Statistics en la lista Campos.
2. Seleccione el elemento para la dimensión de medida en la lista Dimensiones de TM1.
3. Pulse Crear nuevo, especifique el nombre del elemento de medida en el diálogo Nombre de medida
de TM1 y pulse Aceptar.
Para especificar una porción para una dimensión regular:
1. Seleccione la dimensión en la lista Dimensiones de TM1.
2. Pulse Crear porción en.
3. En el diálogo Seleccionar miembro de hoja, seleccione el elemento que especifica la porción y, a
continuación, pulse Aceptar. Puede buscar un elemento específico especificando una cadena de
búsqueda en el cuadro de texto Buscar y pulsando Buscar siguiente. Se encuentra una coincidencia si
alguna de la parte de un elemento coincide con la cadena de búsqueda.
Capítulo 3. Archivos de datos 43
vLos espacios incluidos en la cadena de búsqueda se incluyen en la búsqueda.
vLas búsquedas no distinguen entre mayúsculas y minúsculas.
vEl asterisco (*) se trata como cualquier otro carácter y no indica una búsqueda comodín.
Puede eliminar una definición de correlación seleccionando el elemento correlacionado en la lista
Dimensiones de TM1 y pulsando Eliminar correlación. Puede suprimir la especificación de una medida
nueva seleccionando la medida en la lista Dimensiones de TM1 y pulsando Suprimir.
Comparación de conjuntos de datos
La función de comparación de conjuntos de datos compara el conjunto de datos activo con otro conjunto
de datos en la sesión actual o en un archivo externo en formato IBM SPSS Statistics.
Para comparar conjuntos de datos
1. Abra un archivo de datos y asegúrese de que es el conjunto de datos activo. (Puede convertir el
conjunto de datos activo haciendo clic en la ventana Editor de datos de ese conjunto de datos.)
2. Elija en los menús:
Datos >Comparar conjuntos de datos
3. Seleccione el conjunto de datos abierto o el archivo de datos de IBM SPSS Statistics que desea
comparar con el conjunto de datos activo.
4. Seleccione uno o más campos (variables) que desee comparar.
Si lo desea, puede:
vComparar los casos (registros) basados en uno o más valores de ID de caso.
vComparar propiedades de diccionario de datos (etiquetas de campos y valores, valores perdidos del
usuario, nivel de medición, etc).
vCrear un campo de distintivo en el conjunto de datos activo que identifica los casos no
correspondientes.
vCrear nuevos conjuntos de datos que solo contienen casos coincidentes o solo casos que no coinciden.
Comparar conjuntos de datos: pestaña Comparar
La lista de campos coincidentes muestra una lista de los campos con el mismo nombre y el mismo tipo
básico (cadena o numérica) en ambos conjuntos de datos.
1. Seleccione uno o más campos (variables) para comparar. La comparación de los dos conjuntos de
datos se basa en los campos seleccionados únicamente.
2. Para ver una lista de campos que no tienen nombres coincidentes o que no tienen el mismo tipo
básico en ambos conjuntos de datos, haga clic en Campos no coincidentes. Los campos no
coincidentes se excluyen de la comparación de los dos conjuntos de datos.
3. También puede seleccionar uno o más campos de ID de casos (registros) que identifiquen a cada caso.
vSi especifica varios campos de ID de casos, cada combinación exclusiva de valores identifica un caso.
vAmbos archivos se deben clasificar en orden ascendente en los campos de ID de casos. Si los conjuntos
de datos no están aún ordenados, seleccione (marque) Ordenar casos para ordenar ambos conjuntos de
datos en el orden de ID de casos.
vSi no incluye ninguno de los campos de ID de casos, estos se compararán en el orden de los archivos.
Es decir, el primer caso (registro) del conjunto de datos activo se compara con el primero caso del otro
conjunto de datos, y así sucesivamente.
Comparar conjuntos de datos: campos no coincidentes
El cuadro de diálogo Campos no coincidentes muestra una lista de campos (variables) que se consideran
no coincidentes en los dos conjuntos de datos. Un campo no coincidente es un campo que falta de uno
44 Guía del usuario de IBM SPSS Statistics 23 Core System
de los conjuntos de datos que no es del mismo tipo básico (cadena o numérico) en ambos archivos. Los
campos no coincidentes se excluyen de la comparación de los dos conjuntos de datos.
Comparar conjuntos de datos: pestaña Atributos
De forma predeterminada, solo se comparan valores de datos y los atributos de campo (propiedades de
diccionario de datos) como etiquetas de valores, valores perdidos del usuario y nivel de medición no se
comparan. Para comparar atributos de campo:
1. En el cuadro de diálogo Comparar conjuntos de datos, haga clic la pestaña Atributos.
2. Haga clic para comparar los diccionarios de datos.
3. Seleccione los atributos que desea comparar.
vAmplitud. En campos numéricos, el número máximo de caracteres que se muestra (dígitos y caracteres
de formato, como símbolos de divisa, símbolos de agrupación e indicador decimal). En los campos de
cadena, se permite el número máximo de bytes.
vEtiqueta. Etiqueta descriptiva de campo.
vEtiqueta de valor. Etiquetas descriptivas de valores.
vPerdidos. Valores perdidos del usuario.
vColumnas. Ancho de columna en la vista de datos del editor de datos.
vAlineación. Alineación en la vista de datos del editor de datos.
vMedida. Nivel de medición.
vPapel. Papel del campo.
vAtributos. Atributos de campo personalizado definidos por el usuario.
Comparación de conjuntos de datos: pestaña Resultados
De forma predeterminada, Comparar conjuntos de datos crea un nuevo campo en el conjunto de datos
activo que identifica casos que no coinciden y produce una tabla que proporciona detalles de los 100
primeros casos no coincidentes. Puede utilizar la pestaña Resultados para cambiar las opciones de
resultados.
Señalar las no coincidencias en un campo nuevo. Un nuevo campo que identifica casos no coincidentes
que se crean en el conjunto de datos activo.
vEl valor de este campo nuevo es 1 si existen diferenciasy0sitodos los valores son los mismos. Si
existen casos (registros) en el conjunto de datos activo que no están presentes en el otro conjunto de
datos, el valor es -1.
vEl nombre predeterminado del nuevo campo es CompararCasos. Puede especificar un nombre de campo
diferente. El nombre debe cumplir las normas de denominación de campos (variables). Consulte el
tema “Nombres de variable” en la página 56 para obtener más información.
Copiar casos coincidentes a un nuevo conjunto de datos. Crea un nuevo conjunto de datos que solo
contienen casos (registros) del conjunto de datos activo que tienen valores coincidentes en el otro
conjunto de datos. El nombre del conjunto de datos debe cumplir las normas de denominación de
campos (variables). Si el conjunto de datos ya existe, se sobrescribirá.
Copiar casos no coincidentes a un nuevo conjunto de datos. Crea un nuevo conjunto de datos que solo
contienen casos del conjunto de datos activo que tienen valores diferentes en el otro conjunto de datos. El
nombre del conjunto de datos debe cumplir las normas de denominación de campos (variables). Si el
conjunto de datos ya existe, se sobrescribirá.
Limitar la tabla caso por caso. En los casos (registros) en el conjunto de datos activo que también existen
en el otro conjunto de datos y también tienen el mismo tipo básico (cadena o numérico) en ambos
conjuntos de datos, la tabla de caso por caso proporciona información sobre los valores no coincidentes
Capítulo 3. Archivos de datos 45
de cada caso. De forma predeterminada, la tabla está limitada a los 100 primeros elementos no
coincidentes. Puede especificar un valor diferente o cancelar la selección (desmarcar) este elemento para
que incluya todos los elementos no coincidentes.
Protección de datos originales
Para evitar la modificación o eliminación accidental de los datos originales, puede marcar el archivo
como un archivo de sólo lectura.
1. En los menús del Editor de datos, elija:
Archivo >Marcar archivo como de sólo lectura
Si hace modificaciones posteriores de los datos y, a continuación, intenta guardar el archivo de datos,
puede guardar los datos sólo con un nombre de archivo distinto; así, los datos originales no se verán
afectados.
Puede restablecer los permisos de archivo a lectura/escritura seleccionando la opción Marcar archivo
como de lectura/escritura en el menú Archivo.
Archivo activo virtual
El archivo activo virtual permite trabajar con grandes archivos de datos sin que sea necesaria una
cantidad igual de grande (o mayor) de espacio temporal en disco. Para la mayoría de los procedimientos
de análisis y gráficos, el origen de datos original se vuelve a leer cada vez que se ejecuta un
procedimiento diferente. Los procedimientos que modifican los datos necesitan una cierta cantidad de
espacio temporal en disco para realizar un seguimiento de los cambios; además, algunas acciones
necesitan disponer siempre de la cantidad suficiente de espacio en disco para, al menos, una copia
completa del archivo de datos.
Las acciones que no necesitan ningún espacio temporal en disco son:
vLectura de archivos de datos de IBM SPSS Statistics
vLa fusión de dos o más archivos de datos IBM SPSS Statistics
vLa lectura de tablas de bases de datos con el Asistente para bases de datos
vFusión de archivos de datos IBM SPSS Statistics con tablas de bases de datos
vLa ejecución de procedimientos que leen datos (por ejemplo, Frecuencias, Tablas cruzadas, Explorar)
Las acciones que crean una o más columnas de datos en espacio temporal en disco son:
vEl cálculo de nuevas variables
vLa recodificación de variables existentes
vLa ejecución de procedimientos que crean o modifican variables (por ejemplo, almacenamiento de
valores pronosticados en Regresión lineal)
Las acciones que crean una copia completa del archivo de datos en espacio temporal en disco son:
vLa lectura de archivos de Excel
vLa ejecución de procedimientos que ordenan los datos (por ejemplo, Ordenar casos, Segmentar archivo)
vLa lectura de datos con los comandos GET TRANSLATE oDATA LIST
vLa utilización de la unidad Datos de caché o el comando CACHE
vLa activación de otras aplicaciones de IBM SPSS Statistics que leen el archivo de datos (por ejemplo,
AnswerTree, DecisionTime)
Nota: el comando GET DATA proporciona una funcionalidad comparable a DATA LIST, sin crear una copia
completa del archivo de datos en el espacio temporal del disco. El comando SPLIT FILE de la sintaxis de
46 Guía del usuario de IBM SPSS Statistics 23 Core System
comandos no ordena el archivo de datos y por lo tanto no crea una copia del archivo de datos. Este
comando, sin embargo, necesita tener los datos ordenados para un funcionamiento apropiado y la
interfaz del cuadro de diálogo para este procedimiento ordenará de forma automática el archivo de datos,
con la consiguiente copia completa de dicho archivo. En la versión para estudiantes no está disponible la
sintaxis de comandos.
Acciones que crean una copia completa del archivo de datos de forma predeterminada:
vLectura de bases de datos con el Asistente para bases de datos
vLa lectura de archivos de texto con el Asistente para la importación de texto
El Asistente para la importación de texto proporciona un ajuste opcional para crear de forma automática
una caché de los datos. De forma predeterminada, se selecciona esta opción. Para desactivar esta opción,
simplemente desmarque la casilla de verificación Caché local de los datos. En el Asistente para bases de
datos puede pegar la sintaxis de comando generada y eliminar el comando CACHE.
Creación de una caché de datos
Aunque el archivo actual virtual puede reducir de forma drástica la cantidad de espacio temporal en
disco necesario, la falta de una copia temporal del archivo “activo” significa que el origen original de
datos debe volver a leerse para cada procedimiento. Para archivos de datos grandes leídos desde un
origen externo, la creación de una copia temporal de los datos puede mejorar el rendimiento. Por
ejemplo, para tablas de datos leídas desde un origen de base de datos, la consulta SQL que lee la
información de la base de datos debe volver a ejecutarse para cualquier comando o procedimiento que
necesite leer los datos. Debido a que virtualmente todos los procedimientos de análisis estadísticos y
procedimientos gráficos necesitan leer los datos, la ejecución de la consulta SQL se repite para cada
procedimiento, lo que puede significar un importante incremento en el tiempo de procesamiento si se
ejecuta un gran número de procedimientos.
Si se dispone de suficiente espacio en disco en el ordenador que realiza el análisis (el ordenador local o el
servidor remoto), se pueden eliminar varias consultas SQL y mejorar el tiempo de procesamiento
mediante la creación de una caché de datos del archivo activo. La caché de datos es una copia temporal
de todos los datos.
Nota: de forma predeterminada, el Asistente para bases de datos crea de forma automática una caché de
datos, pero si se utiliza el comando GET DATA en la sintaxis de comandos para leer una base de datos, no
se creará una caché de datos de forma automática. En la versión para estudiantes no está disponible la
sintaxis de comandos.
Para crear una caché de datos
1. Elija en los menús:
Archivo >Caché de los datos...
2. Pulse en Aceptar oenCrear caché ahora.
Aceptar crea una caché de datos la siguiente vez que el programa lea los datos (por ejemplo, la próxima
vez que se ejecute un procedimiento estadístico), que será lo que normalmente se quiera porque no
necesita una lectura adicional de los datos. Crear caché ahora crea una caché de datos inmediatamente, lo
cual no será necesario la mayoría de las veces. Crear caché ahora se utiliza principalmente por dos
razones:
vUn origen de datos está “bloqueado” y no se puede actualizar por nadie hasta que finalice la sesión
actual, abra un origen de datos diferente o haga una caché de los datos.
vPara grandes orígenes de datos, el desplazamiento por el contenido de la pestaña Vista de datos en el
Editor de datos será mucho más rápido si se hace una caché de datos.
Capítulo 3. Archivos de datos 47
Para crear una caché de datos de forma automática
Se puede utilizar el comando SET para crear de forma automática una caché de datos después de un
número especificado de cambios en el archivo de datos activo. De forma predeterminada, se crea una
caché del archivo de datos de forma automática cada 20 cambios realizados sobre el archivo.
1. Elija en los menús:
Archivo >Nuevo >Sintaxis
2. En la ventana de sintaxis, escriba SET CACHE n (donde nrepresenta el número de cambios realizados
en el archivo de datos activo antes de crear una caché del archivo).
3. En los menús de la ventana de sintaxis, elija:
Ejecutar >Todo
Nota: El ajuste de la caché no se almacena entre sesiones. Cada vez que se inicia una nueva sesión, se
toma el valor predeterminado de la opción que es 20.
48 Guía del usuario de IBM SPSS Statistics 23 Core System
Capítulo 4. Análisis en modo distribuido
El análisis en modo distribuido permite utilizar un ordenador que no es el local (o de escritorio) para
realizar trabajos que requieren un gran consumo de memoria. Debido a que los servidores remotos
utilizados para análisis distribuidos son normalmente más potentes y rápidos que los ordenadores
locales, un análisis en modo distribuido puede reducir significativamente el tiempo de procesamiento del
ordenador. El análisis distribuido con un servidor remoto puede ser útil si el trabajo trata:
vArchivos de datos, en particular lecturas de datos de orígenes de bases de datos.
vTareas que requieren un gran consumo de memoria. Cualquier tarea que tarde bastante tiempo en el
análisis en modo local será una buena candidata para el análisis distribuido,
El análisis distribuido sólo afecta a las tareas relacionadas con los datos, como lectura de datos,
transformación de datos, cálculo de nuevas variables y cálculo de estadísticos. El análisis distribuido no
tiene ningún efecto sobre tareas relacionadas con la edición de resultados, como la manipulación de
tablas dinámicas o la modificación de gráficos.
Nota: el análisis distribuido sólo está disponible si dispone tanto de una versión local como de acceso a
una versión de servidor con licencia del software instalado en un servidor remoto.
Acceso al servidor
El cuadro de diálogo Acceso al servidor permite seleccionar el ordenador para procesar comandos y
ejecutar procedimientos. Puede seleccionar el ordenador local o un servidor remoto.
Se pueden añadir, modificar o eliminar servidores remotos de la lista. Los servidores remotos requieren
normalmente un ID de usuario y una contraseña; también puede ser necesario un nombre de dominio. Si
tiene licencia para utilizar Statistics Adapter y su sitio ejecuta IBM SPSS Collaboration and Deployment
Services es posible que pueda conectarse a un servidor remoto mediante inicio de sesión único. El inicio
de sesión único permite a los usuarios conectarse a un servidor remoto sin proporcionar explícitamente
una ID de usuario y una contraseña. La autenticación necesaria se realiza con las credenciales del usuario
actual en el equipo actual, que se obtiene, por ejemplo, de Windows Active Directory. Póngase en
contacto con el administrador del sistema para obtener información acerca de servidores, ID de usuario y
contraseñas, nombres de dominio disponibles y demás información necesaria para la conexión,
incluyendo si el inicio de sesión único es compatible en su sitio.
Puede seleccionar un servidor predeterminado y guardar el ID de usuario, nombre de dominio y
contraseña asociados a cualquier servidor. De esta manera, se conectará de forma automática al servidor
predeterminado en el momento de iniciar la sesión.
Importante: puede conectarse a un servidor que no sea del mismo nivel de versión que el cliente. El
servidor puede ser uno o des versiones más moderno o más antiguo que el cliente. Sin embargo, no se
recomienda mantener esta configuración durante más tiempo. Si el servidor es más moderno que el
cliente, el servidor puede generar resultados que no pueda leer el cliente. Si el cliente es más moderno
que el servidor, es posible que el servidor no reconozca la sintaxis enviada por el cliente. Por lo tanto,
debería ponerse en contacto con su administrador para saber cómo conectarse a un servidor que tiene la
misma versión que el cliente.
Si tiene licencia para utilizar Statistics Adapter y su sitio ejecuta IBM SPSS Collaboration and Deployment
Services 3.5 o posterior, puede pulsar en Búsqueda... para ver una lista de servidores disponibles en su
red. Si no ha iniciado sesión en IBM SPSS Collaboration and Deployment Services Repository, se le
solicitará que introduzca la información de conexión antes de poder ver la lista de servidores.
© Copyright IBM Corp. 1989, 2014 49
Adición y edición de la configuración de acceso al servidor
Utilice el cuadro de diálogo Configuración del acceso al servidor para añadir o editar la información de
conexión para servidores remotos para utilizar en los análisis en modo distribuido.
Para obtener una lista de servidores disponibles, los números de puerto para dichos servidores y toda la
información adicional necesaria para la conexión, póngase en contacto con el administrador del sistema.
No utilice el Nivel de socket seguro a menos que lo indique el administrador.
Nombre del servidor. Un “nombre” de servidor puede ser un nombre alfanumérico asignado a un
ordenador (por ejemplo, ServidorRed) o una dirección IP exclusiva asignada a un ordenador (por
ejemplo, 202.123.456.78).
Número de puerto. El número de puerto es el puerto que el software del servidor utiliza para las
comunicaciones.
Descripción. Puede introducir una descripción opcional para que se visualice en la lista de servidores.
Conectar con Nivel de socket seguro. Las encriptaciones de Nivel de socket seguro (SSL) requieren el
análisis distribuido cuando se envían al servidor remoto. Antes de utilizar el SSL, consulte con el
administrador. Para que esta opción se active, SSL debe estar configurado en su equipo de escritorio y en
el servidor.
Para seleccionar, cambiar o añadir servidores
1. Elija en los menús:
Archivo >Cambiar servidor...
Para seleccionar un servidor predeterminado:
2. En la lista de servidores, seleccione la casilla que se encuentra junto al servidor que desea utilizar.
3. Si el servidor está configurado para el inicio de sesión único, asegúrese de que Establecer
credenciales no está seleccionada. De lo contrario, seleccione Establecer credenciales e introduzca el
ID de usuario, nombre de dominio y contraseña suministrados por el administrador.
Nota: de esta manera, se conectará de forma automática al servidor predeterminado en el momento
de iniciar la sesión.
Para cambiar a otro servidor:
4. Seleccione el servidor de la lista.
5. Si el servidor está configurado para el inicio de sesión único, asegúrese de que Establecer
credenciales no está seleccionada. De lo contrario, seleccione Establecer credenciales e introduzca el
ID de usuario, nombre de dominio y contraseña (si fuera necesario).
Nota: al cambiar de servidor durante una sesión, se cierran todas las ventanas abiertas. Se solicitará
guardar los cambios antes de que se cierren las ventanas.
Para añadir un servidor:
6. Solicite al administrador la información de conexión del servidor.
7. Pulse en Añadir para abrir el cuadro de diálogo Configuración del acceso al servidor.
8. Introduzca la información de conexión y la configuración opcional y pulse en Aceptar.
Para editar un servidor:
9. Solicite al administrador la información de conexión revisada.
10. Pulse en Editar para abrir el cuadro de diálogo Configuración del acceso al servidor.
11. Introduzca los cambios y pulse en Aceptar.
Para buscar servidores disponibles:
50 Guía del usuario de IBM SPSS Statistics 23 Core System
Nota: la capacidad para buscar servidores disponibles sólo está disponible si tiene licencia para
utilizar Statistics Adapter si su sitio ejecuta IBM SPSS Collaboration and Deployment Services 3.5 o
posterior.
12. Pulse en Buscar... para abrir el cuadro de diálogo Buscar servidores. Si no está conectado a IBM SPSS
Collaboration and Deployment Services Repository, se le solicitará información de conexión.
13. Seleccione uno o varios servidores disponibles y pulse en Aceptar. Los servidores se mostrarán en el
cuadro de diálogo Acceso al servidor.
14. Para conectar con uno de los servidores siga las indicaciones para cambiar a otro servidor.
Búsqueda de servidores disponibles
Utilice el cuadro de diálogo Buscar servidores para elegir uno o varios servidores disponibles en la red.
Este cuadro de diálogo aparece al pulsar en Buscar... en el cuadro de diálogo Acceso al servidor.
Seleccione uno o más servidores y pulse en Aceptar para añadirlos al cuadro de diálogo Acceso al
servidor. Aunque es posible añadir servidores manualmente al cuadro de diálogo Acceso al servidor, la
opción de búsqueda de servidores disponibles permite conectar con los servidores sin necesidad de
conocer el nombre correcto y número de puerto del servidor. Esta información se proporciona
automáticamente. No obstante, deberá disponer de la información de inicio de sesión correcta, como
nombre de usuario, dominio y contraseña.
Apertura de archivos de datos desde un servidor remoto
En el análisis en modo distribuido, el cuadro de diálogo Abrir archivo remoto sustituye al cuadro de
diálogo estándar Abrir archivo.
vEl contenido de la lista de archivos, carpetas y unidades muestra lo que hay disponible en o desde el
servidor remoto. En la parte superior del cuadro de diálogo se indica el nombre del servidor actual.
vEn el análisis en modo distribuido, sólo tendrá acceso a los archivos del equipo local si especifica la
unidad como un dispositivo compartido y las carpetas que contienen los archivos de datos como
carpetas compartidas. Consulte la documentación de su sistema operativo para obtener información
sobre cómo "compartir" carpetas del equipo local con la red del servidor.
vSi el servidor está ejecutando un sistema operativo diferente (por ejemplo, usted dispone de Windows
y el servidor se ejecuta bajo UNIX), probablemente no dispondrá de acceso a los archivos de datos
locales en el análisis en modo distribuido, aunque los archivos estén en carpetas compartidas.
Acceso a archivo en análisis en modo local y distribuido
La presentación de carpetas de datos (directorios) y las unidades para el ordenador local y la red está en
función del ordenador que está utilizando para procesar comandos y ejecutar procedimientos, que no es
necesariamente el ordenador que tiene delante.
Análisis en modo local. Cuando utiliza el ordenador local como el "servidor", la visualización de los
archivos de datos, las carpetas y las unidades que ve en el cuadro de diálogo de acceso a los archivos
(para la apertura de archivos de datos) es similar a lo que ve en otras aplicaciones o en el Explorador de
Windows. Se pueden ver todos los archivos de datos y las carpetas en el ordenador y cualquier archivo y
carpeta en las unidades de red.
Análisis en modo distribuido. Cuando utiliza otro ordenador como “servidor remoto” para ejecutar
comandos y procedimientos, la visualización de los archivos de datos y las unidades representa la vista
desde el servidor remoto. Aunque vea nombres de carpetas que le son familiares (como Archivos de
programas y unidades como C), estas no son las carpetas y unidades del ordenador local, sino las del
servidor remoto.
En el análisis en modo distribuido, sólo tendrá acceso a los archivos de datos del equipo local si
especifica la unidad como un dispositivo compartido y las carpetas que contienen los archivos de datos
Capítulo 4. Análisis en modo distribuido 51
como carpetas compartidas. Si el servidor está ejecutando un sistema operativo diferente (por ejemplo,
usted dispone de Windows y el servidor se ejecuta bajo UNIX), probablemente no dispondrá de acceso a
los archivos de datos locales en el análisis en modo distribuido, aunque los archivos estén en carpetas
compartidas.
El análisis en modo distribuido no es lo mismo que acceder a archivos de datos que se encuentran en
otro ordenador de la red. Se puede acceder a archivos de datos en otros dispositivos de red tanto en
análisis en modo local como en análisis en modo distribuido. En modo local, se accede a otros
dispositivos desde el ordenador local. En el modo distribuido, se accede a otros dispositivos de red desde
el servidor remoto.
Si no está seguro de si está utilizando el análisis en modo local o distribuido, mire la barra de título en el
cuadro de diálogo para acceder a archivos de datos. Si el título del cuadro de diálogo contiene la palabra
remoto (como en Abrir archivo remoto) o si el texto Servidor remoto: [nombre de servidor] aparece en la
parte superior del cuadro de diálogo, estará utilizando el modo de análisis distribuido.
Nota: esta situación afecta sólo a los cuadros de diálogo para acceder a archivos de datos (por ejemplo,
Abrir datos, Guardar datos, Abrir base de datos y Aplicar diccionario de datos). Para todos los demás
tipos de archivos (por ejemplo, archivos del Visor, archivos de sintaxis y archivos de scripts) se utiliza la
visualización local.
Disponibilidad de procedimientos en análisis en modo distribuido
En el análisis en modo distribuido, estarán disponibles sólo aquellos procedimientos instalados en la
versión local y en la versión del servidor remoto.
Si dispone de componentes opcionales instalados en el ordenador local que no están disponibles en el
servidor remoto, y cambia del ordenador local a un servidor remoto, los procedimientos afectados se
eliminarán de los menús y la sintaxis de comandos relacionada generará errores. Todos los
procedimientos afectados se restaurarán al cambiar de nuevo al modo local.
Especificaciones de rutas absolutas frente a rutas relativas
En el modo de análisis distribuido, las especificaciones de las rutas relativas para los archivos de datos y
los archivos de sintaxis de comandos son relativas al servidor actual, no al equipo local. Una
especificación de ruta de acceso como /misdocs/misdatos.sav no indica un directorio y archivo en la unidad
local, sino que indica un directorio y archivo en el disco duro del servidor remoto.
Especificaciones de ruta de acceso UNC para Windows
Si utiliza la versión de servidor para Windows, puede usar las especificaciones de la UNC (convención de
denominación universal) al acceder a los archivos de datos y sintaxis mediante la sintaxis de comandos.
El formato general de una especificación UNC es:
\\servername\sharename\path\filename
vNombre_servidor es el nombre del ordenador que contiene el archivo de datos.
vNombre_compartido es la carpeta (directorio) en el ordenador que aparece designada como una carpeta
compartida.
vRuta es cualquier ruta de acceso de carpetas (subdirectorios) por debajo de la carpeta compartida.
vNombre_archivo es el nombre del archivo de datos.
A continuación se muestra un ejemplo:
GET FILE=’\\hqdev001\public\july\sales.sav’.
52 Guía del usuario de IBM SPSS Statistics 23 Core System
Si el ordenador no tiene un nombre asignado, puede utilizar su dirección IP, como en:
GET FILE=’\\204.125.125.53\public\july\sales.sav’.
Incluso con especificaciones de ruta de acceso UNC, sólo se puede acceder a archivos de datos y de
sintaxis que estén en carpetas y dispositivos compartidos. Cuando se utiliza análisis en modo distribuido,
esta situación incluye archivos de datos y de sintaxis del ordenador local.
Especificaciones de rutas absolutas para UNIX
En las versiones de servidor para UNIX, no hay un equivalente a las rutas UNC y todas las rutas de
acceso de los directorios deben ser rutas absolutas que comienzan en la raíz del servidor; las rutas
relativas no están permitidas. Por ejemplo, si el archivo de datos está ubicado en /bin/data y el directorio
actual también es /bin/data, la sintaxis GET FILE=’sales.sav’ no es válida; debe especificar la ruta
completa, como en:
GET FILE=’/bin/sales.sav’.
INSERT FILE=’/bin/salesjob.sps’.
Capítulo 4. Análisis en modo distribuido 53
54 Guía del usuario de IBM SPSS Statistics 23 Core System
Capítulo 5. Editor de datos
El Editor de datos proporciona un método práctico (al estilo de las hojas de cálculo) para la creación y
edición de archivos de datos. La ventana Editor de datos se abre automáticamente cuando se inicia una
sesión.
El Editor de datos proporciona dos vistas de los datos.
vVista de datos. Esta vista muestra los valores de datos reales o las etiquetas de valor definidas.
vVista de variables. Esta vista muestra la información de definición de las variables, que incluye las
etiquetas de la variable definida y de valor, tipo de dato (por ejemplo, cadena, fecha o numérico), nivel
de medición (nominal, ordinal o de escala) y los valores perdidos del usuario.
En ambas vistas, se puede añadir, modificar y eliminar la información contenida en el archivo de datos.
Vista de datos
Muchas de las características de la Vista de datos son similares a las que se encuentran en aplicaciones de
hojas de cálculo. Sin embargo, existen varias diferencias importantes:
vLas filas son casos. Cada fila representa un caso o una observación. Por ejemplo, cada individuo que
responde a un cuestionario es un caso.
vLas columnas son variables. Cada columna representa una variable o una característica que se mide.
Por ejemplo, cada elemento en un cuestionario es una variable.
vLas casillas contienen valores. Cada casilla contiene un valor único de una variable para cada caso. La
casilla se encuentra en la intersección del caso y la variable. Las casillas sólo contienen valores de
datos. A diferencia de los programas de hoja de cálculo, las casillas del Editor de datos no pueden
contener fórmulas.
vEl archivo de datos es rectangular. Las dimensiones del archivo de datos vienen determinadas por el
número de casos y de variables. Se pueden introducir datos en cualquier casilla. Si introduce datos en
una casilla fuera de los límites del archivo de datos definido, el rectángulo de datos se ampliará para
incluir todas las filas y columnas situadas entre esa casilla y los límites del archivo. No hay casillas
“vacías” en los límites del archivo de datos. Para variables numéricas, las casillas vacías se convierten
en el valor perdido del sistema. Para variables de cadena, un espacio en blanco se considera un valor
válido.
Vista de variables
La Vista de variables contiene descripciones de los atributos de cada variable del archivo de datos. En la
Vista de variables:
vLas filas son variables.
vLas columnas son atributos de las variables.
Se pueden añadir o eliminar variables, y modificar los atributos de las variables, incluidos los siguientes:
vNombre de variable
vTipo de dato
vNúmero de dígitos o caracteres
vNúmero de decimales
vLas etiquetas descriptivas de variable y de valor
vValores perdidos del usuario
vAncho de columna
55
vNivel de medición
Todos estos atributos se guardan al guardar el archivo de datos.
Además de la definición de propiedades de variables en la Vista de variables, hay dos otros métodos
para definir las propiedades de variables:
vEl Asistente para la copia de propiedades de datos ofrece la posibilidad de utilizar un archivo de datos
IBM SPSS Statistics externo u otro conjunto de datos que esté disponible en la sesión actual como
plantilla para definir las propiedades del archivo y las variables del conjunto de datos activo. También
puede utilizar variables del conjunto de datos activo como plantillas para otras variables del conjunto
de datos activo. La opción Copiar propiedades de datos está disponible en el menú Datos en la
ventana Editor de datos.
vLa opción Definir propiedades de variables (también disponible en el menú Datos de la ventana Editor
de datos) explora los datos y muestra una lista con todos los valores de datos exclusivos para las
variables seleccionadas, indica los valores sin etiquetas y ofrece una característica de etiquetas
automáticas. Este método es especialmente útil para las variables categóricas que utilizan códigos
numéricos para representar las categorías (por ejemplo, 0 = hombre,1=mujer.
Para visualizar o definir los atributos de las variables
1. Haga que el editor de datos sea la ventana activa.
2. Pulse dos veces en un nombre de variable en la parte superior de la columna en la Vista de datos o
bien pulse en la pestaña Vista de variables.
3. Para definir variables nuevas, introduzca un nombre de variable en cualquier fila vacía.
4. Seleccione los atributos que desea definir o modificar.
Nombres de variable
Para los nombres de variable se aplican las siguientes normas:
vCada nombre de variable debe ser exclusivo; no se permiten duplicados.
vLos nombres de variable pueden tener una longitud de hasta 64 bytes y el primer carácter debe ser una
letra o uno de estos caracteres: @,#o$.Loscaracteres posteriores puede ser cualquier combinación de
letras, números, caracteres que no sean signos de puntuación y un punto (.). En el modo de página de
código, sesenta y cuatro bytes suelen equivaler a 64 caracteres en idiomas de un solo byte (por
ejemplo, inglés, francés, alemán, español, italiano, hebreo, ruso, griego, árabe y tailandés) y 32
caracteres en los idiomas de dos bytes (por ejemplo, japonés, chino y coreano). Muchos caracteres de
una cadena ocuparán un solo byte en el modo de página de código y dos o más bytes en el modo
Unicode. Por ejemplo, é ocupa un byte en el formato de página de código pero dos bytes en el formato
Unicode; por lo que résumé ocupa seis bytes en un archivo de página de código y ocho bytes en modo
Unicode.
Nota: las letras incluyen todos los caracteres que no son signos de puntuación y se utilizan al escribir
palabras normales en los idiomas admitidos en el juego de caracteres de la plataforma.
vLas variables no pueden contener espacios.
vUn carácter # en la primera posición de un nombre de variable define una variable transitorio. Sólo
puede crear variables transitorios mediante la sintaxis de comandos. No puede especificar un # como
primer carácter de una variable en los cuadros de diálogo que permiten crear nuevas variables.
vUn signo $ en la primera posición indica que la variable es una variable del sistema. El signo $ no se
admite como carácter inicial de una variable definida por el usuario.
vEl punto, el subrayado y los caracteres $,#y@sepueden utilizar dentro de los nombres de variable.
Por ejemplo, A._$@#1 es un nombre de variable válido.
vSe deben evitar los nombres de variable que terminan con un punto, ya que el punto puede
interpretarse como un terminador del comando. Sólo puede crear variables que finalicen con un punto
en la sintaxis de comandos. No puede crear variables que terminen con un punto en los cuadros de
diálogo que permiten crear nuevas variables.
56 Guía del usuario de IBM SPSS Statistics 23 Core System
vSe deben evitar los nombres de variable que terminan con un carácter de subrayado, ya que tales
nombres puede entrar en conflicto con los nombres de variable creados automáticamente por
comandos y procedimientos.
vLas palabras reservadas no se pueden utilizar como nombres de variable. Las palabras reservadas son
ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO y WITH.
vLos nombres de variable se pueden definir combinando de cualquier manera caracteres en mayúsculas
y en minúsculas, esta distinción entre mayúsculas y minúsculas se conserva en lo que se refiere a la
presentación.
vCuando es necesario dividir los nombres largos de variable en varias líneas en los resultados, las líneas
se dividen aprovechando los subrayados, los puntos y cuando el contenido cambia de minúsculas a
mayúsculas.
Nivel de medición de variable
Puede especificar el nivel de medición como Escala (datos numéricos de una escala de intervalo o de
razón), Ordinal o Nominal. Los datos nominales y ordinales pueden ser de cadena (alfanuméricos) o
numéricos.
vNominal. Una variable puede ser tratada como nominal cuando sus valores representan categorías que
no obedecen a una clasificación intrínseca. Por ejemplo, el departamento de la compañía en el que
trabaja un empleado. Algunos ejemplos de variables nominales son: región, código postal o confesión
religiosa.
vOrdinal. Una variable puede ser tratada como ordinal cuando sus valores representan categorías con
alguna clasificación intrínseca. Por ejemplo, los niveles de satisfacción con un servicio, que abarquen
desde muy insatisfecho hasta muy satisfecho. Entre los ejemplos de variables ordinales se incluyen
escalas de actitud que representan el grado de satisfacción o confianza y las puntuaciones de
evaluación de las preferencias.
vEscalas. Una variable puede tratarse como escala (continua) cuando sus valores representan categorías
ordenadas con una métrica con significado, por lo que son adecuadas las comparaciones de distancia
entre valores. Son ejemplos de variables de escala: la edad en años y los ingresos en dólares.
Nota: Para variables de cadena ordinales, se asume que el orden alfabético de los valores de cadena indica
el orden correcto de las categorías. Por ejemplo, en una variable de cadena cuyos valores sean bajo,medio,
alto, se interpreta el orden de las categorías como alto,bajo,medio (orden que no es el correcto). Por norma
general, se puede indicar que es más fiable utilizar códigos numéricos para representar datos ordinales.
Para nuevas variables numéricas creadas con transformaciones, los datos de orígenes externos y los
archivos de datos de IBM SPSS Statistics creados antes de la versión 8, el nivel de medición
predeterminado está determinado por las condiciones de la tabla siguiente. Las condiciones se evalúan en
el orden de la tabla. Se aplicará el nivel de medición de la primera condición que coincida con los datos.
Tabla 6. Reglas para determinar el nivel de medición
Condición Nivel de medición
Faltan todos los valores de una variable Nominal
El formato es dólar o una divisa personalizada Continuo
El formato es la fecha u hora (excluyendo mes y día de la semana) Continuo
La variable contiene al menos un valor no entero Continuo
La variable contiene al menos un valor negativo Continuo
La variable contiene valores no válidos inferiores a 10.000 Continuo
La variable tiene No más valores válidos, valores exclusivos* Continuo
La variable tiene valores no válidos inferiores a 10 Continuo
La variable tiene menos de Nvalores válidos, exclusivos* Nominal
Capítulo 5. Editor de datos 57
*Nes un valor de corte especificado por el usuario. El valor predeterminado es 24.
vPuede cambiar el valor de corte en el cuadro de diálogo Opciones. Consulte el tema “Datos: Opciones”
en la página 219 para obtener más información.
vEl cuadro de diálogo Definir propiedades de variables, disponible en el menú Datos, puede ayudarle a
asignar el nivel de medición correcto. Consulte el tema “Asignación del nivel de medición” en la
página 78 para obtener más información.
Tipo de variable
Tipo de variable especifica los tipos de datos de cada variable. De forma predeterminada, se asume que
todas las variables nuevas son numéricas. Se puede utilizar Tipo de variable para cambiar el tipo de
datos. El contenido del cuadro de diálogo Tipo de variable depende del tipo de datos seleccionado. Para
algunos tipos de datos, hay cuadros de texto para la anchura y el número de decimales; para otros tipos
de datos, simplemente puede seleccionar un formato de una lista desplegable de ejemplos.
Los tipos de datos disponibles son los siguientes:
Numérico. Una variable cuyos valores son números. Los valores se muestran en formato numérico
estándar. El Editor de datos acepta valores numéricos en formato estándar o en notación científica.
Coma. Una variable numérica cuyos valores se muestran con comas que delimitan cada tres posiciones y
con el punto como delimitador decimal. El Editor de datos acepta valores numéricos para este tipo de
variables con o sin comas, o bien en notación científica. Los valores no pueden contener comas a la
derecha del indicador decimal.
Punto. Una variable numérica cuyos valores se muestran con puntos que delimitan cada tres posiciones y
con la coma como delimitador decimal. El Editor de datos acepta valores numéricos para este tipo de
variables con o sin puntos, o bien en notación científica. Los valores no pueden contener puntos a la
derecha del indicador decimal.
Notación científica. Una variable numérica cuyos valores se muestran con una E intercalada y un
exponente con signo que representa una potencia de base 10. El Editor de datos acepta para estas
variables valores numéricos con o sin el exponente. El exponente puede aparecer precedido por una E o
una D con un signo opcional, o bien sólo por el signo (por ejemplo, 123, 1,23E2, 1,23D2, 1,23E+2 y
1,23+2).
Fecha. Una variable numérica cuyos valores se muestran en uno de los diferentes formatos de
fecha-calendario u hora-reloj. Seleccione un formato de la lista. Puede introducir las fechas utilizando
como delimitadores: barras inclinadas, guiones, puntos, comas o espacios. El rango de siglo para los
valores de año de dos dígitos está determinado por la configuración de las opciones (en el menú Edición,
seleccione Opciones y, a continuación, pulse en la pestaña Datos).
Dólar. Una variable numérica que se muestra con un signo dólar inicial ($), comas que delimitan cada
tres posiciones y un punto como delimitador decimal. Se pueden introducir valores de datos con o sin el
signo dólar inicial.
Moneda personalizada. Una variable numérica cuyos valores se muestran en uno de los formatos de
moneda personalizados que se hayan definido previamente en la pestaña Moneda del cuadro de diálogo
Opciones. Los caracteres definidos en la moneda personalizada no se pueden emplear en la introducción
de datos pero sí se mostrarán en el Editor de datos.
Cadena. Una variable cuyos valores no son numéricos y, por lo tanto, no se utilizan en los cálculos. Los
valores pueden contener cualquier carácter siempre que no se exceda la longitud definida. Las
mayúsculas y las minúsculas se consideran diferentes. Este tipo también se conoce como variable
alfanumérica.
58 Guía del usuario de IBM SPSS Statistics 23 Core System
Numérico restringido. Una variable cutos valores están restringidos para enteros no negativos. Los
valores aparecen con los ceros iniciales llenando el ancho máximo de la variable. Los valores se pueden
introducir en notación científica.
Para definir el tipo de variable
1. Pulse en el botón de la casilla Tipo de la variable que se quiere definir.
2. Seleccione el tipo de datos en el cuadro de diálogo Tipo de variable.
3. Pulse en Aceptar.
Formatos de entrada frente a formatos de presentación
Dependiendo del formato, la presentación de valores en la Vista de datos puede ser diferente del valor
real que se ha introducido y almacenado internamente. A continuación, se proporcionan algunas normas
generales:
vPara formatos numéricos, de coma y de punto, se pueden introducir valores con cualquier número de
dígitos decimales (hasta 16) y el valor completo se almacena internamente. La Vista de datos muestra
sólo el número definido de dígitos decimales y redondea los valores con más decimales. Sin embargo,
el valor completo se utiliza en todos los cálculos.
vPara las variables de cadena, todos los valores se rellenan por la derecha hasta el ancho máximo. Para
una variable de cadena con un ancho de tres, un valor de No se almacena internamente como ’No ’ y
no es equivalente a ’ No’.
vPara formatos de fecha, se pueden utilizar guiones, barras inclinadas, espacios, comas o puntos como
separadores entre valores de día, mes y año; se pueden introducir números, abreviaciones de tres letras
o nombres completos para el valor de mes. Las fechas del formato general dd-mmm-aa aparecen
separadas por guiones y con abreviaciones de tres letras para el mes. Las fechas del formato general
dd/mm/aa ymm/dd/aa se muestran con barras inclinadas como separadores y números para el mes.
Internamente, las fechas se almacenan como el número de segundos transcurridos desde el 14 de
octubre de 1582. El rango de siglo para años de dos dígitos está determinado por la configuración de
las opciones (en el menú Edición, seleccione Opciones y, a continuación, pulse en la pestaña Datos).
vPara formatos de hora, se pueden utilizar dos puntos, puntos o espacios como separadores entre horas,
minutos y segundos. Las horas se muestran separadas por dos puntos. Internamente, las horas se
almacenan como el número de segundos que representa un intervalo de tiempo. Por ejemplo, 10:00:00
se almacena internamente como 36000, que es 60 (segundos por minuto) x 60 (minutos por hora) x 10
(horas).
Etiquetas de variable
Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud (128 caracteres en los
idiomas de doble byte). Las etiquetas de variable pueden contener espacios y caracteres reservados que
no se admiten en los nombres de variable.
Para especificar etiquetas de variable
1. Haga que el editor de datos sea la ventana activa.
2. Pulse dos veces en un nombre de variable en la parte superior de la columna en la Vista de datos o
bien pulse en la pestaña Vista de variables.
3. Escriba la etiqueta de variable descriptiva en la casilla Etiqueta de la variable.
Etiquetas de valores
Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es especialmente
útil si el archivo de datos utiliza códigos numéricos para representar categorías que no son numéricas
(por ejemplo, códigos1y2para hombre ymujer).
Para especificar etiquetas de valor
1. Pulse en el botón de la casilla Valores de la variable que se quiere definir.
2. Para cada valor, escriba el valor y una etiqueta.
Capítulo 5. Editor de datos 59
3. Pulse en Añadir para introducir la etiqueta de valor.
4. Pulse en Aceptar.
Inserción de saltos de línea en etiquetas
Las etiquetas de valor y las de variable se dividen automáticamente en varias líneas en los gráficos y en
las tablas dinámicas si el ancho de casilla o el área no es suficiente para mostrar la etiqueta entera en una
línea. Se pueden editar los resultados para insertar saltos de línea manuales si se quiere dividir la
etiqueta en un punto diferente. También puede crear etiquetas de variable y de valor que siempre se
dividan en puntos especificados y se muestren en varias líneas.
1. Para etiquetas de variable, seleccione la casilla Etiqueta de la variable en la Vista de variables del
Editor de datos.
2. Para etiquetas de valor, seleccione la casilla Valores correspondiente a la variable en la Vista de
variables del Editor de datos, pulse el botón de la casilla y, a continuación, seleccione la etiqueta que
desea modificar en el cuadro de diálogo Etiquetas de valor.
3. En el punto de la etiqueta en el que desea dividir la etiqueta, escriba \n.
El \n no aparece en las tablas dinámicas ni en los gráficos; se interpreta como un carácter de salto de
línea.
Valores perdidos
Valores perdidos define los valores de los datos definidos como perdidos del usuario. Por ejemplo, es
posible que quiera distinguir los datos perdidos porque un encuestado se niegue a responder de los datos
perdidos porque la pregunta no afecta a dicho encuestado. Los valores de datos que se especifican como
perdidos del usuario aparecen señalados para un tratamiento especial y se excluyen de la mayoría de los
cálculos.
Para definir los valores perdidos
1. Pulse en el botón de la casilla Perdido de la variable que se quiere definir.
2. Introduzca los valores o el rango de valores que representen los datos perdidos.
Papeles
Algunos cuadros de diálogo admiten papeles predefinidos que se pueden utilizar para preseleccionar
variables para el análisis. Cuando abre uno de estos cuadros de diálogo, las variables que cumplen los
requisitos de papeles se muestran automáticamente en la lista(s) de destinos. Los papeles disponibles son:
Entrada. La variable se utilizará como una entrada (por ejemplo, predictor, variable independiente).
Destino. La variable se utilizará como una salida u objetivo (por ejemplo, variable dependiente).
Ambos. La variable se utilizará como entrada y salida.
Ninguno. La variable no tiene asignación de función.
Partición. La variable se utilizará para dividir los datos en muestras diferentes para entrenamiento,
prueba y validación.
Segmentar. Se incluye para compatibilidad global con IBM SPSS Modeler. Las variables con este papel no
se utilizan como variables de segmentación de archivos en IBM SPSS Statistics.
vDe forma predeterminada, todas las variables se asignan al papel Input. Se incluyen los datos de
formatos de archivo externos y los archivos de datos creados en versiones anteriores de IBM SPSS
Statistics anteriores a la versión 18.
vLa asignación de papeles sólo afecta a los cuadros de diálogo que admiten asignaciones de papeles. No
tiene ningún efecto en la sintaxis de comandos.
60 Guía del usuario de IBM SPSS Statistics 23 Core System
Para asignar papeles
1. Seleccione el papel de la lista en la casilla Papel de la variable.
Ancho de columna
Se puede especificar un número de caracteres para el ancho de la columna. Los anchos de columna
también se pueden cambiar en la Vista de datos pulsando y arrastrando los bordes de las columnas.
vEl ancho de columna para fuentes proporcionales se basa en el ancho medio de los caracteres.
Dependiendo de los caracteres utilizados en el valor, se mostrarán más o menos caracteres con el ancho
especificado.
vEl ancho de columna afecta sólo a la presentación de valores en el Editor de datos. Al cambiar el ancho
de columna no se cambia el ancho definido de una variable.
Alineación de la variable
La alineación controla la presentación de los valores de los datos y/o de las etiquetas de valor en la Vista
de datos. La alineación predeterminada es a la derecha para las variables numéricasyalaizquierda para
las variables de cadena. Este ajuste sólo afecta a la presentación en la Vista de datos.
Aplicación de atributos de definición de variables a varias variables
Tras definir los atributos de definición de variables correspondientes a una variable, puede copiar uno o
más atributos y aplicarlos a una o más variables.
Se utilizan las operaciones básicas de copiar y pegar para aplicar atributos de definición de variables.
Puede:
vCopiar un único atributo (por ejemplo, etiquetas de valor) y pegarlo en la misma casilla de atributo
para una o más variables.
vCopiar todos los atributos de una variable y pegarlos en una o más variables.
vCrear varias variables nuevas con todos los atributos de una variable copiada.
Aplicación de atributos de definición de variables a varias variables
Para aplicar atributos individuales de una variable definida
1. En Vista de variables, seleccione la casilla de atributos que quiere aplicar a otras variables.
2. Elija en los menús:
Editar >Copiar
3. Seleccione la casilla de atributos a la que quiere aplicar el atributo. (Puede seleccionar varias variables
de destino.)
4. Elija en los menús:
Editar >Pegar
Si pega el atributo en filas vacías, se crean nuevas variables con atributos predeterminados para todos los
atributos excepto para el seleccionado.
Para aplicar todos los atributos de una variable definida
1. En Vista de variables, seleccione el número de fila para la variable con los atributos que quiere
utilizar. (Se resaltará la fila entera.)
2. Elija en los menús:
Editar >Copiar
3. Seleccione los números de fila de las variables a la que desea aplicar los atributos. (Puede seleccionar
varias variables de destino.)
4. Elija en los menús:
Capítulo 5. Editor de datos 61
Editar >Pegar
Generación de varias variables nuevas con los mismos atributos
1. En la Vista de variables, pulse en el número de fila de la variable que tiene los atributos que quiere
utilizar para la nueva variable. (Se resaltará la fila entera.)
2. Elija en los menús:
Editar >Copiar
3. Pulse en el número de la fila vacía situada bajo la última variable definida en el archivo de datos.
4. Elija en los menús:
Editar >Pegar variables...
5. En el cuadro de diálogo Pegar variables, escriba el número de variables que desea crear.
6. Introduzca un prefijo y un número inicial para las nuevas variables.
7. Pulse en Aceptar.
Los nombres de las nuevas variables se compondrán del prefijo especificado, más un número secuencial
que comienza por el número indicado.
Atributos personalizados de variables
Además de los atributos de variable estándar (como las etiquetas de valores, los valores perdidos y el
nivel de medición), puede crear sus propios atributos de variable personalizados. Al igual que los
atributos de variable estándar, estos atributos personalizados se guardan en los archivos de datos IBM
SPSS Statistics. De esta forma, puede crear un atributo de variable que identifique el tipo de respuesta
para las preguntas de encuesta (por ejemplo, selección única, selección múltiple, rellenar) o las fórmulas
empleadas para el cálculo de variables.
Creación de atributos de variable personalizados
Para crear nuevos atributos personalizados:
1. En la Vista de variables, elija en los menús:
Datos >Nuevo atributo personalizado...
2. Arrastre las variables a las que desea asignar el nuevo atributo a la lista y colóquelas en la lista
Variables seleccionadas.
3. Escriba el nombre del atributo. Los nombres de atributo deben cumplir las mismas reglas que los
nombres de variable. Consulte el tema “Nombres de variable” en la página 56 para obtener más
información.
4. Introduzca un valor opcional para el atributo. Si selecciona varias variables, el valor se asignará a
todas las variables seleccionadas. Puede dejar este campo en blanco y especificar valores para cada
variable en la Vista de variables.
Mostrar atributo en Editor de datos. Muestra el atributo en la Vista de variables del Editor de datos.
Para obtener información sobre cómo controlar la presentación de atributos personalizados consulte
“Presentación y edición de los atributos de variable personalizados” a continuación.
Mostrar lista definida de atributos. Muestra una lista de atributos personalizados ya definidos para el
conjunto de datos. Los nombres de atributo que comienzan con un signo de dólar ($) son atributos
reservados que no es posible modificar.
Presentación y edición de los atributos de variable personalizados
Puede mostrar y editar los atributos de variable personalizados en la Vista de variables del Editor de
datos.
vLos nombres de atributos de variable personalizados aparecen entre corchetes.
vLos nombres de atributo que comienzan con un signo de dólar son reservados y no se pueden
modificar.
62 Guía del usuario de IBM SPSS Statistics 23 Core System
vUna casilla en blanco indica que el atributo no existe para la variable; el texto Vacío mostrado en una
casilla indica que el atributo existe para dicha variable pero no se ha asignado ningún valor al atributo
de dicha variable. Una vez que se escribe texto en la casilla, existe el atributo para dicha variable con el
valor que ha introducido.
vSi aparece el texto Matriz..., en una casilla, indica que se trata de una matriz de atributos, un atributo
que contiene varios valores. Pulse en el botón de la casilla para mostrar la lista de valores.
Para mostrar y editar atributos de variable personalizados
1. En la Vista de variables, elija en los menús:
Ver >Personalizar vista de variables...
2. Seleccione (marque) los atributos de variable personalizados que desea mostrar. (Los atributos de
variable personalizados son los que aparecen entre corchetes.)
Una vez que los atributos aparecen en la Vista de variables, puede modificarlos directamente en el Editor
de datos.
Matrices de atributos de variable: El texto Matriz... que se muestra en una casilla para un atributo de
variable personalizado en Vista de variables o en el cuadro de diálogo Atributos personalizados de
variables en Definir propiedades de variables indica que es una matriz de atributos, un atributo que
contiene varios valores. Por ejemplo, podría tener una matriz de atributos que identificara todas las
variables origen para calcular una variable derivada. Pulse en el botón de la casilla para mostrar y editar
la lista de valores.
Personalización de la Vista de variables
Puede utilizar la opción Personalizar Vista de variables para controlar qué atributos se muestran en la
Vista de variables (por ejemplo, nombre, tipo, etiqueta) y el orden en el que aparecen.
vTodos los atributos de variable personalizados asociados al conjunto de datos aparecen entre corchetes.
Consulte el tema “Creación de atributos de variable personalizados” en la página 62 para obtener más
información.
vLos ajustes de presentación personalizados se guardan en los archivos de datos con formato IBM SPSS
Statistics.
vTambién puede controlar la presentación predeterminada y el orden de los atributos en la Vista de
variables. Consulte el tema “Cambio de la Vista de variables predeterminado” en la página 221 para
obtener más información.
Para personalizar la Vista de variables
1. En la Vista de variables, elija en los menús:
Ver >Personalizar vista de variables...
2. Seleccione (marque) los atributos de variable que desea mostrar.
3. Utilice los botones de dirección hacia arriba y hacia abajo para cambiar el orden de la presentación de
los atributos.
Restablecer valores predeterminados. Aplica los ajustes predeterminados de presentación y orden.
Revisión ortográfica
etiquetas de variable y de valor
Para revisar la ortografía de las etiquetas de los valores y las variables:
1. Seleccione la pestaña Vista de variables en la ventana del Editor de datos.
2. Pulse con el botón derecho del ratón en la columna Etiquetas oValores y elija en el menú emergente:
Ortografía
o
Capítulo 5. Editor de datos 63
3. En la Vista de variables, elija en los menús:
Utilidades >Ortografía
o
4. En el cuadro de diálogo Etiquetas de valor, pulse en Ortografía. (Con esto, la revisión ortográfica se
limitará a las etiquetas de valor de una determinada variable.)
La revisión ortográfica se limita a las etiquetas de los valores y las variables de la Vista de variables del
Editor de datos.
Valores de datos de cadena
Para revisar la ortografía de los valores de datos de cadena:
1. Seleccione la pestaña Vista de datos en el Editor de datos.
2. Si lo desea, puede seleccionar una o más variables (columnas) para su comprobación. Para seleccionar
una variable, pulse el nombre de la variable en la parte superior de la columna.
3. Elija en los menús:
Utilidades >Ortografía
vSi no hay ninguna variable seleccionada en Vista de datos, se comprobarán todas las variables de
cadena.
vSi no hay variables de cadena en el conjunto de datos o ninguna de las variables seleccionadas es una
variable de cadena, la opción Ortografía del menú Utilidades estará desactivada.
Personalización de la Vista de variables
Puede utilizar la opción Personalizar Vista de variables para controlar qué atributos se muestran en la
Vista de variables (por ejemplo, nombre, tipo, etiqueta) y el orden en el que aparecen.
vTodos los atributos de variable personalizados asociados al conjunto de datos aparecen entre corchetes.
Consulte el tema “Creación de atributos de variable personalizados” en la página 62 para obtener más
información.
vLos ajustes de presentación personalizados se guardan en los archivos de datos con formato IBM SPSS
Statistics.
vTambién puede controlar la presentación predeterminada y el orden de los atributos en la Vista de
variables. Consulte el tema “Cambio de la Vista de variables predeterminado” en la página 221 para
obtener más información.
Para personalizar la Vista de variables
1. En la Vista de variables, elija en los menús:
Ver >Personalizar vista de variables...
2. Seleccione (marque) los atributos de variable que desea mostrar.
3. Utilice los botones de dirección hacia arriba y hacia abajo para cambiar el orden de la presentación de
los atributos.
Restablecer valores predeterminados. Aplica los ajustes predeterminados de presentación y orden.
Revisión ortográfica
etiquetas de variable y de valor
Para revisar la ortografía de las etiquetas de los valores y las variables:
1. Seleccione la pestaña Vista de variables en la ventana del Editor de datos.
2. Pulse con el botón derecho del ratón en la columna Etiquetas oValores y elija en el menú emergente:
Ortografía
64 Guía del usuario de IBM SPSS Statistics 23 Core System
o
3. En la Vista de variables, elija en los menús:
Utilidades >Ortografía
o
4. En el cuadro de diálogo Etiquetas de valor, pulse en Ortografía. (Con esto, la revisión ortográfica se
limitará a las etiquetas de valor de una determinada variable.)
La revisión ortográfica se limita a las etiquetas de los valores y las variables de la Vista de variables del
Editor de datos.
Valores de datos de cadena
Para revisar la ortografía de los valores de datos de cadena:
1. Seleccione la pestaña Vista de datos en el Editor de datos.
2. Si lo desea, puede seleccionar una o más variables (columnas) para su comprobación. Para seleccionar
una variable, pulse el nombre de la variable en la parte superior de la columna.
3. Elija en los menús:
Utilidades >Ortografía
vSi no hay ninguna variable seleccionada en Vista de datos, se comprobarán todas las variables de
cadena.
vSi no hay variables de cadena en el conjunto de datos o ninguna de las variables seleccionadas es una
variable de cadena, la opción Ortografía del menú Utilidades estará desactivada.
Introducción de datos
En la Vista de datos, puede introducir datos directamente en el Editor de datos. Se puede introducir
datos en cualquier orden. Asimismo, se pueden introducir datos por caso o por variable, para áreas
seleccionadas o para casillas individuales.
vSe resaltará la casilla activa.
vEl nombre de la variable y el número de fila de la casilla activa aparecen en la esquina superior
izquierda del Editor de datos.
vCuando seleccione una casilla e introduzca un valor de datos, el valor se muestra en el editor de
casillas situado en la parte superior del Editor de datos.
vLos valores de datos no se registran hasta que se pulsa Intro o se selecciona otra casilla.
vPara introducir datos distintos de los numéricos, en primer lugar, se debe definir el tipo de variable.
Si introduce un valor en una columna vacía, el Editor de datos creará automáticamente una nueva
variable y asignará un nombre de variable.
Para introducir datos numéricos
1. Seleccione una casilla en la Vista de datos.
2. Introduzca el valor de los datos. (El valor se muestra en el editor de casillas situado en la parte
superior del Editor de datos.)
3. Para registrar el valor, pulse Intro o seleccione otra casilla.
Para introducir datos no numéricos
1. Pulse dos veces en un nombre de variable en la parte superior de la columna en la Vista de datos o
bien pulse en la pestaña Vista de variables.
2. Pulse en el botón de la casilla Tipo de la variable.
3. Seleccione el tipo de datos en el cuadro de diálogo Tipo de variable.
Capítulo 5. Editor de datos 65
4. Pulse en Aceptar.
5. Pulse dos veces en el número de fila o pulse en la pestaña Vista de datos.
6. Introduzca en la columna los datos de la variable que se va a definir.
Para utilizar etiquetas de valor en la introducción de datos
1. Si las etiquetas de valor no aparecen en la Vista de datos, elija en los menús:
Ver >Etiquetas de valor
2. Pulse la casilla en la que quiere introducir el valor.
3. Elija una etiqueta de valor en la lista desplegable.
De este modo se introducirá el valor y la etiqueta de valor se mostrará en la casilla.
Nota: este proceso sólo funciona si ha definido etiquetas de valor para la variable.
Restricciones de los valores de datos en el Editor de datos
El ancho y el tipo de variable definidos determinan el tipo de valor que se puede introducir en la casilla
en la Vista de datos.
vSi escribe un carácter no permitido por el tipo de variable definido, no se introducirá dicho carácter.
vPara variables de cadena, no se permiten los caracteres que sobrepasen el ancho definido.
vPara variables numéricas, se pueden introducir valores enteros que excedan el ancho definido, pero el
Editor de datos mostrará la notación científica o una parte del valor seguido por puntos suspensivos
(...) para indicar que el valor es más ancho que el ancho definido. Para mostrar el valor de la casilla,
cambie el ancho definido de la variable.
Nota: cambiar el ancho de la columna no afecta al ancho de la variable.
edición de datos
Con el Editor de datos es posible modificar un archivo de datos en Vista de datos de muchas maneras.
Puede:
vCambiar los valores de datos
vCortar, copiar y pegar valores de datos
vAñadir y eliminar casos
vAñadir y eliminar variables
vCambiar el orden de las variables
Para reemplazar o modificar un valor de datos
Para eliminar el valor anterior e introducir un valor nuevo
1. En la Vista de datos, pulse dos veces en la casilla. (Su valor aparecerá en el editor de casillas.)
2. Edite el valor directamente en la casilla o en el editor de casillas.
3. Pulse Intro o seleccione otra casilla para registrar el nuevo valor.
Cortar, copiar y pegar valores de datos
Puede cortar, copiar y pegar valores de casillas individuales o grupos de valores en el Editor de datos.
Puede:
vMover o copiar un único valor de casilla a otra casilla
vMover o copiar un único valor de casilla a un grupo de casillas
vMover o copiar los valores de un único caso (fila) a varios casos
vMover o copiar los valores de una única variable (columna) a varias variables
66 Guía del usuario de IBM SPSS Statistics 23 Core System
vMover o copiar un grupo de valores de casillas a otro grupo de casillas
Conversión de datos para valores pegados en el Editor de datos
Si los tipos de variable definidos de las casillas de origen y de destino no son iguales, el Editor de datos
intentará convertir el valor. Si no es posible realizar la conversión, el valor perdido del sistema se
insertará en la casilla de destino.
Conversión de numérico o fecha a cadena. Los formatos numéricos (por ejemplo, numérico, dólar, de
punto o de coma) y de fechas se convierten en cadenas si se pegan en una casilla de variable de cadena.
El valor de cadena es el valor numérico tal como se muestra en la casilla. Por ejemplo, para la variable
con formato de dólar, el signo dólar que se muestra se convierte en parte del valor de cadena. Los valores
que sobrepasan el ancho de la variable de cadena definida quedan cortados.
Conversión de cadena a numérico o fecha. Los valores de cadena que contienen caracteres admisibles
por el formato numérico o de fecha de la casilla de destino se convierten al valor numérico o de fecha
equivalente. Por ejemplo, un valor de cadena de 25/12/91 se convierte a una fecha válida si el tipo de
formato de la casilla de destino es uno de los formatos día-mes-año, pero se convierte en perdido del
sistema si el tipo de formato de la casilla de destino es uno de los formatos mes-día-año.
Conversión de fecha a numérico. Los valores de fecha y hora se convierten a un número de segundos si
la casilla de destino es uno de los formatos numéricos (por ejemplo, numérico, dólar, de punto o de
coma). Al almacenarse internamente las fechas como el número de segundos transcurridos desde el 14 de
octubre de 1582, la conversión de fechas a valores numéricos puede generar números extremadamente
grandes. Por ejemplo, la fecha 10/29/91 se convierte al valor numérico 12.908.073.600.
Conversión de numérico a fecha u hora. Los valores numéricos se convierten a fechas u horas si el valor
representa un número de segundos que puede producir una fecha u hora válidos. Para las fechas, los
valores numéricos menores que 86.400 se convierten al valor perdido del sistema.
Inserción de nuevos casos
Al introducir datos en una casilla de una fila vacía, se crea automáticamente un nuevo caso. El Editor de
datos inserta el valor perdido del sistema para el resto de las variables de dicho caso. Si hay alguna fila
vacía entre el nuevo caso y los casos existentes, las filas en blanco también se convierten en casos nuevos
con el valor perdido del sistema para todas las variables. También puede insertar nuevos casos entre
casos existentes.
Para insertar nuevos casos entre los casos existentes
1. En la Vista de datos, seleccione cualquier casilla del caso (fila) debajo de la posición donde desea
insertar el nuevo caso.
2. Elija en los menús:
Editar >Insertar casos
Se inserta una fila nueva para el caso y todas las variables reciben el valor perdido del sistema.
Inserción de nuevas variables
La introducción de datos en una columna vacía en la Vista de datos o en una fila vacía en la Vista de
variables crea de forma automática una variable nueva con un nombre de variable predeterminado (el
prefijo var y un número secuencial) y un tipo de formato de datos predeterminado (numérico). El Editor
de datos inserta el valor perdido del sistema en todos los casos de la nueva variable. Si hay columnas
vacías en la Vista de datos o filas vacías en Vista de variables entre la nueva variable y las variables
existentes, estas filas o columnas también se convierten en nuevas variables con el valor perdido del
sistema para todos los casos. También se pueden insertar variables nuevas entre las variables existentes.
Capítulo 5. Editor de datos 67
Para insertar nuevas variables entre variables existentes
1. Seleccione cualquier casilla de la variable a la derecha (Vista de datos) o debajo (Vista de variables) de
la posición donde desea insertar la nueva variable.
2. Elija en los menús:
Editar >Insertar variable
Se insertará una nueva variable con el valor perdido del sistema para todos los casos.
Para mover variables
1. Para seleccionar la variable, pulse en el nombre de variable de la Vista de datos o en el número de fila
para la variable de la Vista de variables.
2. Arrastre y suelte la variable en la nueva ubicación.
3. Si desea colocar la variable entre dos variables ya existentes: en la Vista de datos, arrastre la variable
sobre la columna de variables a la derecha del lugar donde desea colocar la variable, o en la Vista de
variables, arrastre la variable a la fila de variables debajo de donde desee colocarla.
Para cambiar el tipo de datos
Puede cambiar el tipo de datos de una variable en cualquier momento mediante el cuadro de diálogo
Tipo de variable de la Vista de variables. El Editor de datos intentará convertir los valores existentes en el
nuevo tipo. Si no se puede realizar esta conversión, se asignará el valor perdido del sistema. Las reglas
de conversión son las mismas que las del pegado de valores de datos en una variable con distinto tipo de
formato. Si el cambio del formato de los datos puede generar la pérdida de las especificaciones de valores
perdidos o de las etiquetas de valor, el Editor de datos mostrará un cuadro de alerta solicitando
confirmación para proseguir o cancelar la operación.
Búsqueda de casos, variables o imputaciones
El cuadro de diálogo Ir a busca el número (fila) del caso especificado o el nombre de la variable en el
Editor de datos.
Casos
1. Para los casos, elija en los menús:
Editar >Ir a caso...
2. Escriba un valor entero que represente el número de fila actual en la Vista de datos.
Nota: el número de fila actual de un determinado caso puede cambiar debido al orden o a otras acciones.
Variables
1. Para las variables, elija en los menús:
Editar >Ir a la variable...
2. Escriba el nombre de la variable o seleccione la variable en la lista desplegable.
Imputaciones
1. Elija en los menús:
Editar >Ir a la imputación...
2. Seleccione la imputación (o datos originales) en la lista desplegable.
También puede seleccionar la imputación en la lista desplegable de la barra de edición en Vista de datos
del Editor de datos.
68 Guía del usuario de IBM SPSS Statistics 23 Core System
La posición relativa de caso se mantiene al seleccionar imputaciones. Por ejemplo, si hay 1.000 casos en el
conjunto de datos original, el caso 1.034, el 34º caso de la primera imputación, aparece en la parte
superior de la cuadrícula. Si selecciona la imputación 2en la lista desplegable, el caso 2034, el 34º caso de
la segunda imputación, aparecerá en la parte superior de la cuadrícula. Si selecciona Datos originales en
la lista desplegable, el caso 34 aparecerá en la parte superior de la cuadrícula. La posición de columna
también se mantiene al desplazarse entre imputaciones, de modo que es fácil comparar valores entre
imputaciones.
Búsqueda y sustitución de datos y valores de atributo
Para buscar o sustituir valores de datos en la Vista de datos o valores de atributos en la Vista de
variables:
1. Pulse en una casilla de la columna en la que desea buscar. (La búsqueda y sustitución de valores se
limita a una única columna.)
2. Elija en los menús:
Editar >Buscar
o
Editar >Reemplazar
Vista de datos
vNo se puede buscar en la Vista de datos. La dirección de búsqueda es siempre hacia abajo.
vPara fechas y horas, se buscan los valores con formato, es decir, tal como aparecen en la Vista de datos.
Por ejemplo, si se busca la fecha 10-28-2007 no se encontrará una fecha que aparezca como 10/28/2007.
vPara las demás variables numéricas, Contiene,Comienza por yTermina por buscan valores con
formato. Por ejemplo, con la opción Comienza por, un valor de búsqueda de $123 para una variable
con formato dólar encontrará tanto 123,00 como 123,40 pero no 1.234 dólares. Con la opción Casilla
entera, el valor de búsqueda puede tener formato o no (formato numérico F simple), pero sólo se
buscarán valores numéricos exactos (con la precisión mostrada en el Editor de datos).
vEl valor numérico perdido del sistema se representa con un único punto (.) Para encontrar valores
perdidos del sistema, introduzca un único punto como valor de búsqueda y seleccione Casilla entera.
vSi se muestran las etiquetas de valor para la columna de variable seleccionada, se buscará el texto de la
etiqueta y no el valor de datos subyacente. Además, no podrá sustituir el texto de la etiqueta.
Vista de variables
vLa búsqueda sólo está disponible para Nombre,Etiqueta,Valores,Perdidos y las columnas de atributos de
variable personalizados.
vLa sustitución sólo está disponible para Etiqueta,Valores y columnas de atributos personalizados.
vEn la columna Valores (etiquetas de valor), la cadena de búsqueda puede buscar el valor de datos o una
etiqueta de valor.
Nota: la sustitución del valor de datos eliminará cualquier etiqueta de valor anteriormente asociada a
dicho valor.
Obtención de estadísticos descriptivos para variables seleccionadas
Para obtener estadísticos descriptivos para las variables seleccionadas:
1. Pulse con el botón derecho en las variables seleccionadas en Vista de datos o Vista de variables.
2. En el menú emergente seleccione Estadísticos descriptivos.
De forma predeterminada, las tablas de frecuencia (tablas de recuentos) se muestran para todas las
variables con 24 o menos valores exclusivos. Los estadísticos de resumen se determinan mediante un
nivel de medición de variable y el tipo de datos (numérico o de cadena):
vCadena. No se calculan estadísticos de resumen para variables de cadena.
Capítulo 5. Editor de datos 69
vNivel de medición numérico, nominal o desconocido. Rango, mínimo, máximo, moda.
vNivel de medición numérico, ordinal. Rango, mínimo, máximo, moda, media, mediana.
vNivel de medición numérico, continuo (escala). Rango, mínimo, máximo, moda, media, mediana,
desviación estándar.
También puede obtener gráficos de barras para variables nominales y ordinales, histogramas para
variables continuas (escala) y cambiar el valor de corte que determina cuándo mostrar tablas de
frecuencia. Consulte el tema “Opciones de resultados” en la página 222 para obtener más información.
Estado de selección de casos en el Editor de datos
Si ha seleccionado un subconjunto de casos pero no ha descartado los casos no seleccionados, éstos se
marcarán en el Editor de datos con una línea diagonal (barra inclinada) atravesando el número de fila.
Editor de datos: Opciones de presentación
El menú Ver proporciona varias opciones de presentación para el Editor de datos:
Fuentes. Esta opción controla las características de fuentes de la presentación de datos.
Líneas de cuadrícula. Esta opción activa y desactiva la presentación de las líneas de cuadrícula.
Etiquetas de valor. Esta opción activa y desactiva la presentación de los valores reales de los datos y las
etiquetas de valor descriptivas definidas por el usuario. Esta opción sólo está disponible en la Vista de
datos.
Uso de varias vistas
En la Vista de datos, puede crear varias vistas (paneles) mediante los divisores situados debajo de la
barra de desplazamiento horizontalyaladerecha de la barra de desplazamiento vertical.
También puede utilizar el menú Ventana para insertar y eliminar divisores de paneles. Para insertar
divisores:
1. En la Vista de datos, elija en los menús:
Ventana >Dividir
Los divisores se insertan sobreyalaizquierda de la casilla seleccionada.
vSi se ha seleccionado la casilla superior izquierda, los divisores se insertan para dividir la vista actual
aproximadamente por la mitad horizontal y verticalmente.
Figura 1. Casos filtrados en el Editor de datos
70 Guía del usuario de IBM SPSS Statistics 23 Core System
vSi se selecciona una casilla distinta de la casilla superior de la primera columna, se inserta un divisor
de paneles horizontales sobre la casilla seleccionada.
vSi se selecciona una casilla distinta de la primera casilla de fila superior, se inserta un divisor de
paneles verticales a la izquierda de la casilla seleccionada.
Impresión en el Editor de datos
Los archivos de datos se imprimen tal y como aparece en la pantalla.
vSe imprime la información que está en la vista actualmente mostrada. En la Vista de datos, se
imprimen los datos. En la Vista de variables, se imprime la información de definición de los datos.
vLas líneas de cuadrícula se imprimen si aparecen actualmente en la vista seleccionada.
vLas etiquetas de valor se imprimen si aparecen actualmente en la Vista de datos. En caso contrario, se
imprimirán los valores de datos reales.
Utilice el menú Ver en la ventana Editor de datos para mostrar u ocultar las líneas de cuadrícula y para
que se muestren o no los valores de los datos y las etiquetas de valor.
Para imprimir los contenidos del Editor de datos
1. Haga que el editor de datos sea la ventana activa.
2. Puse la pestaña de la vista que desea imprimir.
3. Elija en los menús:
Archivo >Imprimir...
Capítulo 5. Editor de datos 71
72 Guía del usuario de IBM SPSS Statistics 23 Core System
Capítulo 6. Trabajo con varios orígenes de datos
A partir de la versión 14.0, se pueden tener varios orígenes de datos abiertos al mismo tiempo, lo que
facilita:
vCambiar de un origen de datos a otro.
vComparar el contenido de diferentes orígenes de datos.
vCopiar y pegar datos entre orígenes de datos.
vCrear varios subconjuntos de casos y/o variables para su análisis.
vFundir varios orígenes de datos con diferentes formatos de datos (por ejemplo, hojas de cálculo, bases
de datos, datos en texto) sin tener que guardar antes cada origen de datos.
Tratamiento básico de varios orígenes de datos
De forma predeterminada, cada origen de datos que se abra aparecerá en una nueva ventana del Editor
de datos. (Consulte “Opciones generales” en la página 217 para obtener información sobre cómo cambiar
el comportamiento predeterminado para mostrar sólo un conjunto de datos al mismo tiempo, en una
única ventana del Editor de datos).
vTodos los orígenes de datos que haya abierto anteriormente permanecerán abiertos y estarán
disponibles para su uso.
vAl abrir por primera vez un origen de datos, se convierte automáticamente en el conjunto de datos
activo.
vPara cambiar el conjunto de datos activo basta con pulsar en cualquier parte de la ventana del Editor
de datos del origen de datos que desee utilizar o bien seleccionar la ventana del Editor de datos
correspondiente a dicho origen de datos en el menú Ventana.
vSólo será posible analizar las variables del conjunto de datos activo.
vNo se puede cambiar el conjunto de datos activo mientras esté abierto cualquier cuadro de diálogo que
acceda a los datos (incluidos todos los cuadros de diálogo que muestran las listas de variables).
vAl menos una ventana del Editor de datos debe estar abierta durante una sesión. Al cerrar la última
ventana abierta del Editor de datos, IBM SPSS Statistics se cierra automáticamente, preguntándole
antes si desea guardar los cambios.
Trabajo con varios conjuntos de datos en la sintaxis de comandos
Si utiliza la sintaxis de comandos con los orígenes de datos abiertos (por ejemplo, GET FILE,GET DATA),
tendrá que usar el comando DATASET NAME para indicar explícitamente el nombre de cada conjunto de
datos y poder tener más de un origen de datos abierto al mismo tiempo.
Al trabajar con la sintaxis de comandos, aparece el nombre del conjunto de datos activo en la barra de
herramientas de la ventana de sintaxis. Todas las acciones siguientes pueden cambiar el conjunto de datos
activo:
vUsar el comando DATASET ACTIVATE.
vPulse en cualquier punto de la ventana Editor de datos de un conjunto de datos.
vSeleccione un nombre de conjunto de datos en la lista desplegable Activo de la barra de herramientas
de la ventana de sintaxis.
Copia y pegado de información entre conjuntos de datos
Puede copiar tanto datos como atributos de definición de variables de un conjunto de datos a otro,
básicamente de la misma manera que copia y pega información en un archivo de datos único.
73
vAl copiar y pegar determinadas casillas de datos en la Vista de datos se pegan únicamente los valores
de los datos, sin los atributos de definición de variables.
vSi se copia y pega una variable entera en la Vista de datos seleccionando el nombre de dicha variable
que aparece en la parte superior de la columna, se pegarán todos los datos y todos los atributos de
definición de variables correspondientes a dicha variable.
vAl copiar y pegar los atributos de definición de variables o las variables enteras en la Vista de
variables, se pegarán los atributos seleccionados (o toda la definición de la variable) pero no se pegará
ningún valor de los datos.
Cambio del nombre de los conjuntos de datos
Al abrir un origen de datos utilizando los menús y los cuadros de diálogo, se le asignará
automáticamente a cada origen de datos un nombre de conjunto de datos Conjunto_de_datosn, donde nes
un número entero secuencial, y al abrir un origen de datos utilizando la sintaxis de comandos, no se
asignará ningún nombre de conjunto de datos a menos que se especifique uno explícitamente utilizando
DATASET NAME . Para especificar nombres de conjuntos de datos más descriptivos:
1. En los menús de la ventana del Editor de datos correspondientes al conjunto de datos cuyo nombre
desea cambiar, seleccione:
Archivo >Cambiar nombre de conjunto de datos...
2. Escriba un nuevo nombre de conjunto de datos que cumpla las reglas de denominación de variables.
Consulte el tema “Nombres de variable” en la página 56 para obtener más información.
Supresión de varios conjuntos de datos
Si prefiere tener un único conjunto de datos disponible al mismo tiempo y desea suprimir la característica
de varios conjuntos de datos:
1. Elija en los menús:
Editar >Opciones...
2. Pulse en la pestaña General.
Seleccione (active) Abrir sólo un conjunto de datos cada vez.
Consulte el tema “Opciones generales” en la página 217 para obtener más información.
74 Guía del usuario de IBM SPSS Statistics 23 Core System
Capítulo 7. Preparación de los datos
Cuando abra un archivo de datos o introduzca datos en el Editor de datos, podrá empezar a crear
informes, gráficos y análisis sin ningún trabajo preliminar adicional. Sin embargo, hay algunas
características de preparación adicional de los datos que pueden resultarle útiles, entre las que se
incluyen:
vAsignar propiedades de las variables que describan los datos y determinen cómo se deben tratar
ciertos valores.
vIdentificar los casos que pueden contener información duplicada y excluir dichos casos de los análisis o
eliminarlos del archivo de datos.
vCrear nuevas variables con algunas categorías distintas que representen rangos de valores de variables
que tengan un mayor número de valores posibles.
Propiedades de variables
Los datos introducidos en la Vista de datos del Editor de datos o leídos desde un formato de archivos
externo (como una hoja de cálculo de Excel o un archivo de datos de texto) carecen de ciertas
propiedades de variables que pueden resultar muy útiles, como:
vDefinición de etiquetas de valor descriptivas para códigos numéricos (por ejemplo, 0 = Hombre y1=
Mujer).
vIdentificación de códigos de valores perdidos (por ejemplo, 99 = No procede).
vAsignación del nivel de medición (nominal, ordinal o de escala).
Todas estas propiedades de variables (y otras) se pueden asignar en la Vista de variables del Editor de
datos. También hay algunas utilidades que le pueden ofrecer asistencia en este proceso:
vDefinir propiedades de variables puede ayudarle a definir etiquetas de valor descriptivas y valores
perdidos. Esto es especialmente útil para datos categóricos con códigos numéricos utilizados para
valores de categorías. Consulte el tema “Definición de propiedades de variables” para obtener más
información.
vDefinir nivel de medición para desconocido identifica las variables (campos) que no tengan un nivel
de medición definido y permite definir el nivel de medición de esas variables. Es importante para los
procedimientos en los que el nivel de medición puede afectar a los resultados o determinar qué
características estarán disponibles. Consulte el tema “Definición del nivel de medición para variables
con un nivel de medición desconocido” en la página 79 para obtener más información.
vCopiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos con IBM SPSS
Statistics como plantilla para definir las propiedades de variables y archivos en el archivo de datos
actual. Esto es particularmente útil si utiliza frecuentemente archivos de datos con un formato externo
que tenga un contenido similar, como puedan ser informes mensuales en formato Excel. Consulte el
tema “Copia de propiedades de datos” en la página 81 para obtener más información.
Definición de propiedades de variables
Definir propiedades de variables está diseñado para ayudarle en el proceso de asignar atributos a
variables, incluyendo la creación de etiquetas de valor descriptivas para variables categóricas (nominales
u ordinales). Definir propiedades de variables:
vExplora los datos reales y enumera todos valores de datos exclusivos para cada variable seleccionada.
vIdentifica valores sin etiquetas y ofrece una característica de “etiquetas automáticas”.
vPermite copiar etiquetas de valor definidas y otros atributos de otra variable en la variable seleccionada
o de la variable seleccionada a varias variables adicionales.
© Copyright IBM Corp. 1989, 2014 75
Nota: para utilizar Definir propiedades de variables sin explorar primero los casos, introduzca 0 para el
número de casos que se van a explorar.
Para definir propiedades de variables
1. Elija en los menús:
Datos >Definir propiedades de variables...
2. Seleccione las variables numéricas o de cadena para las que desea crear etiquetas de valor o definir o
cambiar otras propiedades de las variables, como los valores perdidos o las etiquetas de variable
descriptivas.
3. Especificar el número de casos que se van a explorar para generar la lista de valores exclusivos.
Resulta especialmente útil para los archivos de datos con mayor número de casos, para el cual una
exploración del archivo de datos completo podría tardar una gran cantidad de tiempo.
4. Especifique un límite superior para el número de valores exclusivos que se va a visualizar. Esto es
especialmente útil para evitar que se generen listas de cientos, miles o incluso millones de valores
para las variables de escala (intervalo continuo, razón).
5. Pulse en Continuar para abrir el cuadro de diálogo Definir propiedades de variables principal.
6. Seleccione una variable para la que desee crear etiquetas de valor o definir o cambiar otras
propiedades de las variables.
7. Introduzca el texto de etiqueta para los valores sin etiquetas que se visualicen en Cuadrícula etiqueta
valores.
8. Si hay valores para los que desea crear etiquetas de valor, pero no se visualizan dichos valores,
puede introducirlos en la columna Valores por debajo del último valor explorado.
9. Repita este proceso para cada variable de la lista para la que desee crear etiquetas de valor.
10. Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las variables.
Definición de etiquetas de valor y otras propiedades de las variables
El cuadro de diálogo principal Definir propiedades de variables proporciona la siguiente información
para las variables exploradas:
Lista de variables exploradas. Para cada variable explorada, aparecerá una marca de verificación en la
columna Sin etiqueta (S/E) indicando que la variable contiene valores sin etiquetas de valor asignadas.
Para ordenar la lista de variables para que aparezcan todas las variables con valores sin etiquetas en la
parte superior de la lista:
1. Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de variables exploradas.
También puede ordenarla por nombre de variable o nivel de medición pulsando en el encabezado de
columna correspondiente debajo de la Lista de variables exploradas.
Cuadrícula etiqueta valores
vEtiqueta. Muestra las etiquetas de valor que ya se han definido. Puede añadir o cambiar las etiquetas
de esta columna.
vValor. Valores exclusivos para cada variable seleccionada. Esta lista de valores exclusivos se basa en el
número de casos explorados. Por ejemplo, si sólo ha explorado los primeros 100 casos del archivo de
datos, la lista reflejará sólo los valores exclusivos presentes en esos casos. Si el archivo de datos ya se
ha ordenado por la variable para la que desea asignar etiquetas de valor, la lista puede mostrar
muchos menos valores exclusivos de los que hay realmente presentes en los datos.
vRecuento. Número de veces que aparece cada valor en los casos explorados.
vPerdidos. Valores definidos para representar valores perdidos. Puede cambiar la designación de la
categoría de los valores perdidos pulsando en la casilla de verificación. Una marca indica que la
categoría se ha definido como categoría perdida del usuario. Si una variable ya tiene un rango de
76 Guía del usuario de IBM SPSS Statistics 23 Core System
valores perdidos del usuario (por ejemplo 90 - 99), no podrá añadir ni eliminar categorías de valores
perdidos para esa variable con Definir propiedades de variables. Puede utilizar la Vista de variables del
Editor de datos para modificar las categorías de valores perdidos para la variable con rangos de
valores perdidos. Consulte el tema “Valores perdidos” en la página 60 para obtener más información.
vCambiado. Indica que ha añadido o cambiado una etiqueta de valor.
Nota: si ha especificado 0 para el número de casos que se van a explorar en el cuadro de diálogo inicial,
la cuadrícula etiqueta valores estará en blanco al principio, a excepción de algunas etiquetas de valor ya
existentes y/o categorías de valores perdidos definidas para la variable seleccionada. Además, se
desactivará el botón Sugerir para el nivel de medición.
Nivel de medición. Las etiquetas de valor son especialmente útiles para las variables categóricas
(nominales u ordinales), y algunos procedimientos tratan a las variables categóricas y de escala de
manera diferente, por lo que a veces es importante asignar el nivel de medición correcto. Sin embargo, de
forma predeterminada, todas las nuevas variables numéricas se asignan al nivel de medición de escala.
Por tanto, puede que muchas variables que son de hecho categóricas, aparezcan inicialmente como
variables de escala.
Si no está seguro de qué nivel de medición debe asignar a una variable, pulse en Sugerir.
Papel. Algunos cuadros de diálogo permiten preseleccionar variables para su análisis en función de
papeles definidos. Consulte el tema “Papeles” en la página 60 para obtener más información.
Copiar propiedades. Puede copiar las etiquetas de valor y otras propiedades de las variables de otra
variable a la variable seleccionada en ese momento o desde la variable seleccionada en ese momento a
una o varias otras variables.
Valores sin etiquetas. Para crear automáticamente etiquetas para valores sin etiquetas, pulse en Etiquetas
automáticas.
Etiqueta de variable y formato de presentación
Puede cambiar de la etiqueta de variable descriptiva y el formato de presentación.
vNo puede cambiar el tipo fundamental de la variable (numérica o de cadena).
vPara las variables de cadena, sólo puede cambiar la etiqueta de variable, no el formato de presentación.
vPara las variables numéricas, puede cambiar el tipo numérico (como numérico, fecha, dólar o moneda
personalizada), el ancho (número máximo de dígitos, incluyendo los indicadores decimales y/o de
agrupación) y el número de posiciones decimales.
vPara el formato de fecha numérica, puede seleccionar un formato de fecha específico (como
dd-mm-aaaa, mm/dd/aa, aaaaddd)
vPara formato numérico personalizado, puede seleccionar uno de los cinco formatos de moneda
personalizados (de CCA a CCE). Consulte el tema “Opciones de moneda” en la página 222 para
obtener más información.
vAparece un asterisco en la columna Valor si el ancho especificado es inferior al ancho de los valores
explorados o los valores mostrados para etiquetas de valor definidas ya existentes o categorías de
valores perdidos.
vAparece un período (.) si los valores explorados o los valores mostrados para etiquetas de valor
definidas ya existentes o categorías de valores perdidos no son válidos para el tipo de formato de
presentación seleccionado. Por ejemplo, un valor numérico interno inferior a 86.400 no es válido para
una variable de formato de fecha.
Capítulo 7. Preparación de los datos 77
Asignación del nivel de medición
Cuando pulse en Sugerir para seleccionar un nivel de medición en el cuadro de diálogo principal Definir
propiedades de variables, la variable actual se evalúa en función de los casos explorados y las etiquetas
de valor definidas y se sugiere un nivel de medición en el cuadro de diálogo Sugerir nivel de medición
que se abre. El área Explicación ofrece una breve descripción de los criterios utilizados para proporcionar
el nivel de medición sugerido.
Nota: Los valores definidos para representar valores perdidos no se incluyen en la evaluación para el
nivel de medición. Por ejemplo, la explicación del nivel de medición sugerido puede indicar que la
sugerencia se basa, en parte, en el hecho de que la variable no contiene valores negativos, mientras que,
de hecho, puede contener valores negativos, pero dichos valores ya se han definido como valores
perdidos.
1. Pulse en Continuar para aceptar el nivel de medición sugerido o en Cancelar para mantener el
mismo.
Atributos personalizados de variables
El botón Atributos del cuadro de diálogo Definir propiedades de variables abre el cuadro de diálogo
Atributos personalizados de variables. Además de los atributos de variable estándar, como las etiquetas
de valores, los valores perdidos y el nivel de medición, puede crear sus propios atributos de variable
personalizados. Al igual que los atributos de variable estándar, estos atributos personalizados se guardan
en los archivos de datos IBM SPSS Statistics.
Nombre. Los nombres de atributo deben cumplir las mismas reglas que los nombres de variable.
Consulte el tema “Nombres de variable” en la página 56 para obtener más información.
Valor. Valor asignado al atributo de la variable seleccionada.
vLos nombres de atributo que comienzan con un signo de dólar son reservados y no se pueden
modificar. Puede ver el contenido de un atributo reservado pulsando el botón de la casilla que desee.
vSi aparece el texto Matriz..., en una casilla de valor, indica que se trata de una matriz de atributos,un
atributo que contiene varios valores. Pulse en el botón de la casilla para mostrar la lista de valores.
Copia de propiedades de variables
El cuadro de diálogo Aplicar etiquetas y nivel a aparece al pulsar en De otra variable oA otras variables
en el cuadro de diálogo principal Definir propiedades de variables. Muestra todas las variables
exploradas que coinciden con el tipo de variable actual (de cadena o numérico). Para las variables de
cadena, también debe coincidir la anchura definida.
1. Seleccione una única variable desde la que va a copiar las etiquetas de valor y otras propiedades de
las variables (excepto la etiqueta de la variable).
o