Gu.a Del Usuario De IBM SPSS Statistics 23 Core System IBM_SPSS_Statistics_Core_System_User_Guide User Guide

User Manual: IBM_SPSS_Statistics_Core_System_User_Guide user guide pdf - FTP File Search (15/20)

Open the PDF directly: View PDF .
Page Count: 316 [warning: Documents this large are best viewed by clicking the View PDF Link!]

Contenido
Capítulo 1. Conceptos básicos
- Windows
  - Ventana designada frente a ventana activa
    - Cambio de la ventana designada
- Barra de estado
- Cuadros de diálogo
- Nombres y etiquetas de variable en las listas de los cuadros de diálogo
- Cuadro de diálogo con tamaño ajustado
- Controles del cuadro de diálogo
- Seleccionar variables
- Iconos de tipo de datos, nivel de medición y lista de variables
- Información sobre las variables en un cuadro de diálogo
- Pasos básicos en el análisis de datos
- Asesor estadístico
- Información adicional
Capítulo 2. Obtención de ayuda
- Obtención de ayuda sobre los términos de los resultados
Capítulo 3. Archivos de datos
- Apertura de archivos de datos
- Información sobre el archivo
- Almacenamiento de archivos de datos
- Comparación de conjuntos de datos
- Protección de datos originales
- Archivo activo virtual
  - Creación de una caché de datos
    - Para crear una caché de datos
    - Para crear una caché de datos de forma automática
Capítulo 4. Análisis en modo distribuido
- Acceso al servidor
- Apertura de archivos de datos desde un servidor remoto
- Acceso a archivo en análisis en modo local y distribuido
- Disponibilidad de procedimientos en análisis en modo distribuido
- Especificaciones de rutas absolutas frente a rutas relativas
Capítulo 5. Editor de datos
- Vista de datos
- Vista de variables
- Introducción de datos
- edición de datos
- Búsqueda de casos, variables o imputaciones
- Búsqueda y sustitución de datos y valores de atributo
- Obtención de estadísticos descriptivos para variables seleccionadas
- Estado de selección de casos en el Editor de datos
- Editor de datos: Opciones de presentación
- Impresión en el Editor de datos
  - Para imprimir los contenidos del Editor de datos
Capítulo 6. Trabajo con varios orígenes de datos
- Tratamiento básico de varios orígenes de datos
- Trabajo con varios conjuntos de datos en la sintaxis de comandos
- Copia y pegado de información entre conjuntos de datos
- Cambio del nombre de los conjuntos de datos
- Supresión de varios conjuntos de datos
Capítulo 7. Preparación de los datos
- Propiedades de variables
- Definición de propiedades de variables
- Definición del nivel de medición para variables con un nivel de medición desconocido
- Conjuntos de respuestas múltiples
  - Para definir conjuntos de respuestas múltiples
- Copiar propiedades de datos
  - Copia de propiedades de datos
- Identificación de casos duplicados
- Agrupación visual
Capítulo 8. Transformaciones de los datos
- Transformaciones de los datos
- Cálculo de variables
  - Calcular variable: Si los casos
  - Calcular variable: Tipo y etiqueta
- Funciones
- Valores perdidos en funciones
- Generadores de números aleatorios
- Contar apariciones de valores dentro de los casos
  - Contar valores dentro de los casos: Valores a contar
  - Contar apariciones: Si los casos
- Valores de cambio
- Recodificación de valores
- Recodificar en las mismas variables
  - Recodificar en las mismas variables: Valores antiguos y nuevos
- Recodificar en distintas variables
  - Recodificar en distintas variables: Valores antiguos y nuevos
- Recodificación automática
- Casos de rangos
  - Asignar rangos a los casos: Tipos
  - Asignar rangos a los casos: Empates
- Asistente de fecha y hora
- Transformaciones de los datos de serie temporal
Capítulo 9. Gestión y transformación de los archivos
- Gestión y transformación de los archivos
- Ordenar casos
- Ordenar variables
- Transponer
- Fusión de archivos de datos
  - Añadir casos
  - Añadir variables
    - Añadir variables: cambiar nombre
    - Fusión de más de dos orígenes de datos
- Agregar datos
  - Agregar datos: Función de agregación
  - Agregar datos: Nombre y etiqueta de variable
- Segmentar archivo
- Seleccionar casos
- ponderación de casos
- Reestructuración de los datos
Capítulo 10. Trabajo con resultados
- Trabajo con resultados
- Visor
- Pegado de resultados en otras aplicaciones
- Resultado interactivo
- Exportación de resultados
- Impresión de documentos del Visor
- Almacenamiento de resultados
  - Para guardar un documento del Visor
Capítulo 11. Tablas dinámicas
- Tablas dinámicas
- Manipulación de una tabla dinámica
- Trabajo con capas
  - Creación y visualización de capas
  - Ir a la categoría de capa
- Visualización y ocultación de elementos
- TableLook
  - Para aplicar un TableLook
  - Para editar o crear un TableLook
- Propiedades de tabla
- Propiedades de casilla
- Notas al pie y pies
- Anchos de casillas de datos
- Cambio de ancho de columna
- Visualización de bordes ocultos en una tabla dinámica
- Selección de filas, columnas y casillas en una tabla dinámica
- Impresión de tablas dinámicas
  - Control de saltos de tabla en tablas anchas y largas
- Creación de un gráfico a partir de una tabla dinámica
- Tablas de versiones anteriores
Capítulo 12. Modelos
- Interacción con un modelo
  - Trabajo con el Visor de modelos
    - Propiedades de modelo
    - Copia de vistas de modelo
- Impresión de un modelo
- Exportación de un modelo
- Guardado de campos usados en el modelo en un nuevo conjunto de datos
- Guardado de predictores en un nuevo conjunto de datos según la importancia
- Visor de conjuntos
  - Modelos de conjuntos
- Segmentar Visor de modelos
Capítulo 13. Modificación automatizada de los resultados
- Resultado de estilo: Seleccionar
- Resultado de estilo
- Estilo de tabla
  - Estilo de tabla: Condición
  - Estilo de tabla: Formato
Capítulo 14. Trabajar con sintaxis de comandos
- Reglas de la sintaxis
- Pegar sintaxis desde cuadros de diálogo
  - Para pegar sintaxis desde cuadros de diálogo
- Copia de la sintaxis desde las anotaciones de los resultados
  - Para copiar la sintaxis desde las anotaciones de los resultados
- Uso del editor de sintaxis
- Codificación del juego de caracteres en archivos de sintaxis
- Varios comandos Ejecutar
- Cifrado de archivos de sintaxis
Capítulo 15. Conceptos básicos de la utilidad de gráficos
- Creación y modificación de gráficos
  - Generación de gráficos
    - Generación de un gráfico desde la galería
  - Edición de gráficos
    - Fundamentos del Editor de gráficos
- Opciones de definición de gráfico
  - Adición y edición de títulos y notas al pie
  - Para establecer las opciones generales
Capítulo 16. Puntuación de datos con modelos predictivos
- Asistente para puntuación
- Fusión de archivos XML de transformación y de modelo
Capítulo 17. Utilidades
- Utilidades
- Información sobre la variable
- Comentarios de archivos de datos
- Conjuntos de variables
- Definición de conjuntos de variables
- Uso de conjuntos de variables para mostrar y ocultar variables
- Reordenación de listas de variables de destino
- Paquetes de extensión
Capítulo 18. Opciones
- Opciones
- Opciones generales
- Opciones del Visor
- Datos: Opciones
  - Cambio de la Vista de variables predeterminado
- Opciones de idioma
- Opciones de moneda
  - Para crear formatos de moneda personalizados
- Opciones de resultados
- Opciones de gráfico
- Opciones de tabla dinámica
- Opciones de ubicaciones de archivos
- Opciones de scripts
- Opciones del editor de sintaxis
- Opciones de imputación múltiple
Capítulo 19. Personalización de menús y barras de herramientas
- Personalización de menús y barras de herramientas
- Editor de menús
- Personalización de las barras de herramientas
- Mostrar barras de herramientas
- Para personalizar las barras de herramientas
Capítulo 20. Creación y gestión de diálogos personalizados
- Diseño del generador de cuadros de diálogo personalizados
- Generación de un diálogo personalizado
- Propiedades de cuadro de diálogo
- Especificación de la ubicación de menú para un cuadro de diálogo personalizado
- Diseño de controles en el lienzo
- Generación de la plantilla de sintaxis
- Vista previa de un diálogo personalizado
- Gestión de diálogos personalizados
- Tipos de controles
- Cuadros de diálogo personalizados para comandos de extensión
- Creación de versiones localizadas de diálogos personalizados
Capítulo 21. Trabajos de producción
- Archivos de sintaxis
- Resultados
- Valores en tiempo de ejecución
- Ejecutar opciones
- Acceso al servidor
  - Adición y edición de la configuración de acceso al servidor
- Entradas del usuario
- Estado del trabajo en segundo plano
- Ejecución de trabajos de producción desde una línea de comandos
- Conversión de los archivos de la unidad de producción
Capítulo 22. Sistema de gestión de resultados
- Tipos de objetos de resultados
- Identificadores de comandos y subtipos de tabla
- Etiquetas
- Opciones de SGR
- Registro
- Exclusión de presentación de resultados del Visor
- Envío de resultados a archivos de datos IBM SPSS Statistics
- Estructura de tablas OXML
- Identificadores de SGR
  - Copia de identificadores SGR desde los titulares del Visor
Capítulo 23. Utilidad de scripts
- Autoscripts
  - Creación de autoscripts
  - Asociación de scripts existentes a objetos del visor
- Creación de scripts en lenguaje de programación Python
  - Ejecución de scripts de Python y programas de Python
  - Editor de scripts del lenguaje de programación Python
- Scripts en Basic
  - Compatibilidad con versiones anteriores a 16.0
  - El objeto scriptContext
- Scripts de inicio
Capítulo 24. Convertidor de sintaxis de los comandos TABLES e IGRAPH
Capítulo 25. Cifrado de archivos de datos, documentos de resultados y archivos de sintaxis
Avisos
- Marcas comerciales
Índice
- A
- B
- C
- D
- E
- F
- G
- H
- I
- J
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- X

Guía del usuario de IBM SPSS

Statistics 23 Core System



Nota

Antes de utilizar esta información y el producto al que da soporte, lea la información de “Avisos” en la página 295.

Información del producto

Esta edición se aplica a la versión 23, release 0, modificación 0 de IBM SPSS Statistics y a todos los releases y

modificaciones posteriores hasta que se indique lo contrario en nuevas ediciones.

Contenido

Capítulo 1. Conceptos básicos .....1

Windows ...............1

Ventana designada frente a ventana activa . . . 1

Barra de estado .............2

Cuadros de diálogo ............2

Nombres y etiquetas de variable en las listas de los

cuadros de diálogo ............2

Cuadro de diálogo con tamaño ajustado .....3

Controles del cuadro de diálogo ........3

Seleccionar variables............3

Iconos de tipo de datos, nivel de medición y lista de

variables................4

Información sobre las variables en un cuadro de

diálogo ................4

Pasos básicos en el análisis de datos ......4

Asesor estadístico.............4

Información adicional ...........5

Capítulo 2. Obtención de ayuda ....7

Obtención de ayuda sobre los términos de los

resultados ...............8

Capítulo 3. Archivos de datos .....9

Apertura de archivos de datos ........9

Para abrir archivos de datos ........9

Tipos de archivos de datos ........10

Opciones de apertura de archivos ......10

Lectura de archivos de Excel .......10

Lectura de archivos de Excel y otras hojas de

cálculo de versiones anteriores .......11

Lectura de archivos de dBASE .......11

Lectura de archivos de Stata ........11

Lectura de archivos de bases de datos ....12

Asistente para texto ..........18

Lectura de datos de Cognos BI .......22

Lectura de datos de Cognos TM1 ......24

Lectura de datos de IBM SPSS Data Collection . 25

Información sobre el archivo.........27

Almacenamiento de archivos de datos .....28

Para guardar archivos de datos modificados . . 28

Guardar archivos de datos en la codificación de

caracteres de la página de códigos......28

Almacenamiento de archivos de datos en

formatos externos ...........28

Almacenamiento de archivos de datos en formato

de Excel ..............31

Almacenamiento de archivos de datos en formato

SAS................32

Almacenamiento de archivos de datos en formato

Stata................33

Almacenamiento de subconjuntos de variables . 34

Cifrado de archivos de datos .......34

Exportación a base de datos ........35

Exportación a IBM SPSS Data Collection....41

Exportación a Cognos TM1 ........42

Comparación de conjuntos de datos ......44

Comparar conjuntos de datos: pestaña Comparar 44

Comparar conjuntos de datos: pestaña Atributos 45

Comparación de conjuntos de datos: pestaña

Resultados..............45

Protección de datos originales ........46

Archivo activo virtual ...........46

Creación de una caché de datos ......47

Capítulo 4. Análisis en modo

distribuido .............49

Acceso al servidor ............49

Adición y edición de la configuración de acceso

al servidor..............50

Para seleccionar, cambiar o añadir servidores . . 50

Búsqueda de servidores disponibles .....51

Apertura de archivos de datos desde un servidor

remoto ................51

Acceso a archivo en análisis en modo local y

distribuido ..............51

Disponibilidad de procedimientos en análisis en

modo distribuido ............52

Especificaciones de rutas absolutas frente a rutas

relativas ...............52

Capítulo 5. Editor de datos ......55

Vista de datos .............55

Vista de variables ............55

Para visualizar o definir los atributos de las

variables ..............56

Nombres de variable ..........56

Nivel de medición de variable .......57

Tipo de variable ............58

Etiquetas de variable ..........59

Etiquetas de valores ..........59

Inserción de saltos de línea en etiquetas ....60

Valores perdidos............60

Papeles ...............60

Ancho de columna ...........61

Alineación de la variable .........61

Aplicación de atributos de definición de variables

a varias variables ...........61

Atributos personalizados de variables ....62

Personalización de la Vista de variables ....64

Revisión ortográfica ..........64

Introducción de datos ...........65

Para introducir datos numéricos ......65

Para introducir datos no numéricos .....65

Para utilizar etiquetas de valor en la introducción

de datos ..............66

Restricciones de los valores de datos en el Editor

de datos ..............66

edición de datos .............66

Para reemplazar o modificar un valor de datos 66

Cortar, copiar y pegar valores de datos ....66

iii

Inserción de nuevos casos ........67

Inserción de nuevas variables .......67

Para cambiar el tipo de datos .......68

Búsqueda de casos, variables o imputaciones . . . 68

Búsqueda y sustitución de datos y valores de

atributo................69

Obtención de estadísticos descriptivos para variables

seleccionadas ..............69

Estado de selección de casos en el Editor de datos 70

Editor de datos: Opciones de presentación ....70

Impresión en el Editor de datos .......71

Para imprimir los contenidos del Editor de datos 71

Capítulo 6. Trabajo con varios orígenes

de datos ..............73

Tratamiento básico de varios orígenes de datos . . 73

Trabajo con varios conjuntos de datos en la sintaxis

de comandos ..............73

Copia y pegado de información entre conjuntos de

datos ................73

Cambio del nombre de los conjuntos de datos . . . 74

Supresión de varios conjuntos de datos .....74

Capítulo 7. Preparación de los datos 75

Propiedades de variables ..........75

Definición de propiedades de variables .....75

Para definir propiedades de variables.....76

Definición de etiquetas de valor y otras

propiedades de las variables........76

Asignación del nivel de medición ......78

Atributos personalizados de variables ....78

Copia de propiedades de variables .....78

Definición del nivel de medición para variables con

un nivel de medición desconocido.......79

Conjuntos de respuestas múltiples.......79

Para definir conjuntos de respuestas múltiples. . 80

Copiar propiedades de datos ........81

Copia de propiedades de datos .......81

Identificación de casos duplicados .......85

Agrupación visual ............86

Para agrupar variables..........87

Agrupación de variables .........87

Generación automática de categorías agrupadas 89

Copia de categorías agrupadas .......90

Valores perdidos del usuario en la agrupación

visual ...............90

Capítulo 8. Transformaciones de los

datos ...............93

Transformaciones de los datos ........93

Cálculo de variables ...........93

Calcular variable: Si los casos .......93

Calcular variable: Tipo y etiqueta ......94

Funciones ...............94

Valores perdidos en funciones ........94

Generadores de números aleatorios ......95

Contar apariciones de valores dentro de los casos . 95

Contar valores dentro de los casos: Valores a

contar ...............95

Contar apariciones: Si los casos.......96

Valores de cambio ............96

Recodificación de valores ..........97

Recodificar en las mismas variables ......97

Recodificar en las mismas variables: Valores

antiguos y nuevos ...........97

Recodificar en distintas variables .......98

Recodificar en distintas variables: Valores

antiguos y nuevos ...........98

Recodificación automática .........99

Casos de rangos ............101

Asignar rangos a los casos: Tipos......101

Asignar rangos a los casos: Empates.....102

Asistente de fecha y hora .........102

Fechas y horas en IBM SPSS Statistics ....103

Creación de una variable de fecha/hora a partir

de una cadena ............104

Creación de una variable de fecha/hora a partir

de un conjunto de variables .......104

Adición o sustracción de valores a partir de

variables de fecha/hora .........105

Extracción de parte de una variable de

fecha/hora .............107

Transformaciones de los datos de serie temporal 107

Definir fechas ............108

Crear serie temporal ..........108

Reemplazar los valores perdidos ......110

Capítulo 9. Gestión y transformación

de los archivos ..........113

Gestión y transformación de los archivos ....113

Ordenar casos .............113

Ordenar variables ............114

Transponer ..............115

Fusión de archivos de datos ........115

Añadir casos ............115

Añadir variables ...........117

Agregar datos .............118

Agregar datos: Función de agregación ....120

Agregar datos: Nombre y etiqueta de variable 120

Segmentar archivo............120

Seleccionar casos ............121

Seleccionar casos: si ..........122

Seleccionar casos: muestra aleatoria .....122

Seleccionar casos: rango .........122

ponderación de casos...........122

Reestructuración de los datos ........123

Para reestructurar datos .........123

Asistente de reestructuración de datos:

seleccionar tipo............123

Asistente de reestructuración de datos (variables

a casos): número de grupos de variables . . . 126

Asistente de reestructuración de datos (variables

a casos): seleccionar variables .......127

Asistente de reestructuración de datos (variables

a casos): crear variables de índice......128

Asistente de reestructuración de datos (variables

a casos): crear una variable de índice ....129

Asistente de reestructuración de datos (variables

a casos): crear varias variables de índice . . . 129

Asistente de reestructuración de datos (variables

a casos): opciones ...........130

iv Guía del usuario de IBM SPSS Statistics 23 Core System

Asistente de reestructuración de datos (casos a

variables): seleccionar variables ......130

Asistente de reestructuración de datos (casos a

variables): ordenar datos ........131

Asistente de reestructuración de datos (casos a

variables): opciones ..........131

Asistente de reestructuración de datos: finalizar 132

Capítulo 10. Trabajo con resultados 133

Trabajo con resultados ..........133

Visor ................133

Mostrar y ocultar resultados .......133

Desplazamiento, eliminación y copia de

resultados .............133

Cambio de la alineación inicial ......134

Cambio de la alineación de los elementos de

resultados .............134

Titulares del visor ...........134

Adición de elementos al Visor .......135

Búsqueda y sustitución de información en el

Visor ...............136

Cierre de elementos de resultado ......137

Pegado de resultados en otras aplicaciones . . . 137

Resultado interactivo ...........138

Exportación de resultados .........139

Opciones de HTML ..........140

Opciones de informes web ........141

Opciones de Word/RTF .........142

Opciones de Excel ...........142

Opciones de PowerPoint ........143

Opciones de PDF ...........144

Opciones del texto...........144

Opciones sólo para gráficos .......145

Opciones de formato de gráficos ......145

Impresión de documentos del Visor ......146

Para imprimir resultados y gráficos .....146

Vista previa de impresión ........147

Atributos de página: encabezados y pies . . . 147

Atributos de página: opciones .......147

Almacenamiento de resultados .......148

Para guardar un documento del Visor ....148

Capítulo 11. Tablas dinámicas ....151

Tablas dinámicas ............151

Manipulación de una tabla dinámica .....151

Activación de una tabla dinámica .....151

Pivote de una tabla ..........151

Cambio del orden de visualización de elementos

dentro de una dimensión ........151

Desplazamiento de filas y columnas dentro de

un elemento de una dimensión ......152

Transposición de filas y columnas .....152

Agrupación de filas y columnas ......152

Desagrupación de filas y columnas .....152

Rotación de etiquetas de fila y columna . . . 152

Ordenación de filas ..........152

Inserción de filas y columnas .......153

Control de la visualización de la variable y

etiquetas de valor ...........153

Cambio del idioma de resultados......154

Desplazamiento por tablas grandes .....154

Deshacer cambios ...........154

Trabajo con capas ............155

Creación y visualización de capas .....155

Ir a la categoría de capa .........155

Visualización y ocultación de elementos ....155

Ocultación de filas y columnas en una tabla . . 155

Visualización de filas y columnas ocultas en una

tabla ...............155

Ocultación y visualización de etiquetas de

dimensión .............155

Ocultación y visualización de títulos de tabla 155

TableLook ..............156

Para aplicar un TableLook ........156

Para editar o crear un TableLook ......156

Propiedades de tabla ...........156

Para cambiar las propiedades de la tabla de

pivote:...............157

Propiedades de tabla: general .......157

Propiedades de tabla: notas........158

Propiedades de tabla: formatos de casilla . . . 158

Propiedades de tabla: bordes .......159

Propiedades de tabla: impresión ......159

Propiedades de casilla ..........159

Fuente y fondo ............160

Valor de formato ...........160

Alineación y márgenes .........160

Notas al pie y pies ...........160

Adición de notas al pie y pies .......160

Ocultación o visualización de un pie ....160

Ocultación o visualización de una nota al pie en

una tabla ..............160

Marcador de notas al pie ........161

Nueva numeración de notas al pie .....161

Edición de notas al pie en tablas de versiones

anteriores..............161

Anchos de casillas de datos ........162

Cambio de ancho de columna ........162

Visualización de bordes ocultos en una tabla

dinámica ...............162

Selección de filas, columnas y casillas en una tabla

dinámica ...............163

Impresión de tablas dinámicas........163

Control de saltos de tabla en tablas anchas y

largas...............163

Creación de un gráfico a partir de una tabla

dinámica ...............164

Tablas de versiones anteriores ........164

Capítulo 12. Modelos ........165

Interacción con un modelo .........165

Trabajo con el Visor de modelos ......165

Impresión de un modelo .........166

Exportación de un modelo .........167

Guardado de campos usados en el modelo en un

nuevo conjunto de datos .........167

Guardado de predictores en un nuevo conjunto de

datos según la importancia .........167

Visor de conjuntos............168

Modelos de conjuntos .........168

Segmentar Visor de modelos ........170

Contenido v

Capítulo 13. Modificación

automatizada de los resultados . . . 171

Resultado de estilo: Seleccionar .......171

Resultado de estilo ...........172

Resultado de estilo: Etiquetas y texto ....174

Resultado de estilo: Indexado .......175

Resultado de estilo: Aspectos de tabla ....175

Resultado de estilo: Tamaño .......175

Estilo de tabla .............175

Estilo de tabla: Condición ........176

Estilo de tabla: Formato .........177

Capítulo 14. Trabajar con sintaxis de

comandos.............179

Reglas de la sintaxis ...........179

Pegar sintaxis desde cuadros de diálogo ....180

Para pegar sintaxis desde cuadros de diálogo 180

Copia de la sintaxis desde las anotaciones de los

resultados ..............181

Para copiar la sintaxis desde las anotaciones de

los resultados ............181

Uso del editor de sintaxis .........181

Ventana del editor de sintaxis .......182

Terminología ............183

Autocompletar ............183

Codificación de color ..........184

Puntos de corte............185

Señalizadores ............186

Aplicación o eliminación de comentarios a texto 186

Aplicación de formato a la sintaxis .....187

Ejecución de sintaxis de comandos .....188

Codificación del juego de caracteres en archivos

de sintaxis .............189

Varios comandos Ejecutar ........189

Codificación del juego de caracteres en archivos de

sintaxis ...............190

Varios comandos Ejecutar .........191

Cifrado de archivos de sintaxis .......191

Capítulo 15. Conceptos básicos de la

utilidad de gráficos .........193

Creación y modificación de gráficos ......193

Generación de gráficos .........193

Edición de gráficos ..........194

Opciones de definición de gráfico ......195

Adición y edición de títulos y notas al pie. . . 195

Para establecer las opciones generales ....196

Capítulo 16. Puntuación de datos con

modelos predictivos ........199

Asistente para puntuación .........199

Comparación de campos de modelo con los del

conjunto de datos ...........200

Selección de funciones de puntuación ....202

Puntuación del conjunto de datos activo . . . 203

Fusión de archivos XML de transformación y de

modelo ...............203

Capítulo 17. Utilidades .......205

Utilidades ..............205

Información sobre la variable ........205

Comentarios de archivos de datos ......205

Conjuntos de variables ..........206

Definición de conjuntos de variables......206

Uso de conjuntos de variables para mostrar y

ocultar variables ............206

Reordenación de listas de variables de destino . . 207

Paquetes de extensión ..........207

Creación y edición de paquetes de extensión 207

Instalación de paquetes de extensión locales . . 211

Visualización de los paquetes de extensión

instalados .............213

Modificación de paquetes de extensiones . . . 214

Capítulo 18. Opciones........217

Opciones ...............217

Opciones generales ...........217

Opciones del Visor ...........218

Datos: Opciones ............219

Cambio de la Vista de variables predeterminado 221

Opciones de idioma ...........221

Opciones de moneda ...........222

Para crear formatos de moneda personalizados 222

Opciones de resultados ..........222

Opciones de gráfico ...........223

Colores de los elementos de datos .....223

Líneas de los elementos de datos ......224

Marcadores de los elementos de datos ....224

Rellenos de los elementos de datos .....225

Opciones de tabla dinámica ........225

Opciones de ubicaciones de archivos .....227

Opciones de scripts ...........228

Opciones del editor de sintaxis .......229

Opciones de imputación múltiple.......230

Capítulo 19. Personalización de

menús y barras de herramientas . . . 231

Personalización de menús y barras de herramientas 231

Editor de menús ............231

Personalización de las barras de herramientas . . 231

Mostrar barras de herramientas .......231

Para personalizar las barras de herramientas . . . 232

Propiedades de la barra de herramientas . . . 232

Barra de herramientas de edición......232

Crear nueva herramienta ........233

Capítulo 20. Creación y gestión de

diálogos personalizados ......235

Diseño del generador de cuadros de diálogo

personalizados .............236

Generación de un diálogo personalizado ....236

Propiedades de cuadro de diálogo ......236

Especificación de la ubicación de menú para un

cuadro de diálogo personalizado .......237

Diseño de controles en el lienzo .......238

Generación de la plantilla de sintaxis .....238

Vista previa de un diálogo personalizado ....241

Gestión de diálogos personalizados ......241

vi Guía del usuario de IBM SPSS Statistics 23 Core System

Tipos de controles ............243

Lista de origen ............244

Lista de destino ...........244

Filtrado de listas de variables .......245

Casilla de verificación .........245

Controles de cuadro combinado y cuadro de

lista ...............246

Control de texto ...........247

Control de número ..........248

Control de texto estático.........249

Grupo de elementos ..........249

Grupo de selección ..........250

Grupo de casillas de verificación ......251

Explorador de archivos .........252

Botón de sub-cuadro de diálogo ......253

Cuadros de diálogo personalizados para comandos

de extensión..............254

Creación de versiones localizadas de diálogos

personalizados .............254

Capítulo 21. Trabajos de producción 257

Archivos de sintaxis ...........258

Resultados ..............258

Opciones de HTML ..........259

Opciones de PowerPoint ........260

Opciones de PDF ...........260

Opciones de texto ...........260

Trabajos de producción con comandos OUTPUT 260

Valores en tiempo de ejecución .......261

Ejecutar opciones ............261

Acceso al servidor............262

Adición y edición de la configuración de acceso

al servidor .............262

Entradas del usuario ...........263

Estado del trabajo en segundo plano .....263

Ejecución de trabajos de producción desde una

línea de comandos ...........263

Conversión de los archivos de la unidad de

producción ..............264

Capítulo 22. Sistema de gestión de

resultados.............267

Tipos de objetos de resultados........269

Identificadores de comandos y subtipos de tabla 269

Etiquetas ...............270

Opciones de SGR ............271

Registro ...............273

Exclusión de presentación de resultados del Visor 273

Envío de resultados a archivos de datos IBM SPSS

Statistics ...............274

Archivos de datos creados a partir de varias

tablas ...............274

Control de elementos de columna para las

variables de control del archivo de datos . . . 274

Nombres de variable en los archivos de datos

generados por SGR ..........275

Estructura de tablas OXML.........275

Identificadores de SGR ..........278

Copia de identificadores SGR desde los titulares

del Visor ..............278

Capítulo 23. Utilidad de scripts ....281

Autoscripts ..............282

Creación de autoscripts .........282

Asociación de scripts existentes a objetos del

visor ...............283

Creación de scripts en lenguaje de programación

Python ...............283

Ejecución de scripts de Python y programas de

Python ..............284

Editor de scripts del lenguaje de programación

Python ..............285

Scripts en Basic.............285

Compatibilidad con versiones anteriores a 16.0 286

El objeto scriptContext .........288

Scripts de inicio ............289

Capítulo 24. Convertidor de sintaxis

de los comandos TABLES e IGRAPH . 291

Capítulo 25. Cifrado de archivos de

datos, documentos de resultados y

archivos de sintaxis ........293

Avisos ..............295

Marcas comerciales ...........297

Índice...............299

Contenido vii

viii Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 1. Conceptos básicos

Windows

Existen diversos tipos de ventanas en IBM®SPSS Statistics:

Editor de datos. El Editor de datos muestra el contenido del archivo de datos. Puede crear nuevos

archivos de datos o modificar los existentes con el Editor de datos. Si tiene más de un archivo de datos

abierto, habrá una ventana Editor de datos independiente para cada archivo.

Visor. Todas las tablas, los gráficos y los resultados estadísticos se muestran en el Visor. Puede editar los

resultados y guardarlos para utilizarlos posteriormente. La ventana del Visor se abre automáticamente la

primera vez que se ejecuta un procedimiento que genera resultados.

Editor de tablas dinámicas. Con el Editor de tablas dinámicas es posible modificar los resultados

mostrados en este tipo de tablas de diversas maneras. Puede editar el texto, intercambiar los datos de las

filas y las columnas, añadir colores, crear tablas multidimensionales y ocultar y mostrar los resultados de

manera selectiva.

Editor de gráficos. Puede modificar los gráficos y diagramas de alta resolución en las ventanas de los

gráficos. Es posible cambiar los colores, seleccionar diferentes tipos de fuentes y tamaños, intercambiar

los ejes horizontal y vertical, rotar diagramas de dispersión 3-D e incluso cambiar el tipo de gráfico.

Editor de resultados de texto. Los resultados de texto que no aparecen en las tablas dinámicas pueden

modificarse con el Editor de resultados de texto. Puede editar los resultados y cambiar las características

de las fuentes (tipo, estilo, color y tamaño).

Editor de sintaxis. Puede pegar las selecciones del cuadro de diálogo en una ventana de sintaxis, donde

aparecerán en forma de sintaxis de comandos. A continuación puede editar esta sintaxis de comandos

para utilizar las características especiales que no se encuentran disponibles en los cuadros de diálogo.

También puede guardar los comandos en un archivo para utilizarlos en sesiones posteriores.

Ventana designada frente a ventana activa

Si tiene abiertas varias ventanas del Visor, los resultados se dirigirán hacia la ventana designada del

Visor. Si tiene abierta más de una ventana del Editor de sintaxis, la sintaxis de comandos se pegará en la

ventana designada del Editor de sintaxis. Las ventanas designadas se indican con un signo más en el

icono de la barra de título y es posible cambiarlas en cualquier momento.

La ventana designada no debe confundirse con la ventana activa, que es la ventana actualmente

seleccionada. Si tiene ventanas superpuestas, la ventana activa es la que aparece en primer plano. Si abre

una ventana, esa ventana se convertirá automáticamente en la ventana activa y en la ventana designada.

Cambio de la ventana designada

1. Convierta la ventana que desee designar en la ventana activa (pulse en cualquier punto de la

ventana).

2. Pulse en el botón Designar ventana de la barra de herramientas (la que tiene el icono del signo más).

3. Elija en los menús:

Utilidades >Designar ventana

Nota: en cuanto a las ventanas Editor de datos, la ventana Editor de datos activa determina el conjunto de

datos que se utiliza en análisis o cálculos posteriores. No hay ninguna ventana Editor de datos

"designada". Consulte el tema “Tratamiento básico de varios orígenes de datos” en la página 73 para

obtener más información.

Barra de estado

La barra de estado que aparece en la parte inferior de cada ventana de IBM SPSS Statistics proporciona la

siguiente información:

Estado del comando. En cada procedimiento o comando que se ejecuta, un recuento de casos indica el

número de casos procesados hasta el momento. En los procedimientos estadísticos que requieren

procesamientos iterativos, se muestra el número de iteraciones.

Estado del filtro. Si ha seleccionado una muestra aleatoria o un subconjunto de casos para el análisis, el

mensaje Filtrado indica que existe algún tipo de filtrado activado actualmente y por tanto en el análisis

no se incluyen todos los casos del archivo de datos.

Estado de ponderación. El mensaje Ponderado indica que se está utilizando una variable de ponderación

para ponderar los casos para el análisis.

Estado de Segmentar archivo. El mensaje Segmentar archivo activado indica que el archivo de datos se

ha segmentado en diferentes grupos para su análisis en función de los valores de una o más variables de

agrupación.

Cuadros de diálogo

La mayoría de las opciones de los menús acceden a un cuadro de diálogo cuando se seleccionan. Los

cuadros de diálogo se utilizan para seleccionar variables y opciones para el análisis.

Los cuadros de diálogo para los procedimientos estadísticos tienen normalmente dos componentes

básicos:

Lista de variables de origen. Una lista de variables en el conjunto de datos activo. En la lista de origen

sólo aparecen los tipos de variables que el procedimiento seleccionado permite. La utilización de

variables de cadena corta y de cadena larga está restringida en muchos procedimientos.

Listas de variables de destino. Una o varias listas que indican las variables elegidas para el análisis; un

ejemplo son las listas de variables dependientes e independientes.

Nombres y etiquetas de variable en las listas de los cuadros de

diálogo

Puede mostrar tanto nombres como etiquetas de variable en las listas de los cuadros de diálogo y puede

controlar el orden en el que aparecen las variables en las listas de variables de origen. Para controlar los

atributos de presentación predeterminados de las variables en las listas de origen, elija Opciones en el

menú Editar. Consulte el tema “Opciones generales” en la página 217 para obtener más información.

También puede cambiar los atributos de visualización de la lista de variables en los cuadros de diálogo.

El método para cambiar los atributos de visualización depende del cuadro de diálogo:

vSi el cuadro de diálogo proporciona controles de clasificación y visualización en la lista de variables de

origen, utilícelos para cambiar los atributos de visualización.

vSi el cuadro de diálogo no contiene controles de clasificación de la lista de variables, pulse con el botón

derecho en cualquier variable de la lista de origen y seleccione los atributos de visualización del menú

emergente.

2Guía del usuario de IBM SPSS Statistics 23 Core System

Puede mostrar los nombres o las etiquetas de variable (los nombres se muestran para cualquier variable

sin etiquetas definidas) y puede ordenar la lista de origen por orden de archivo, orden alfabético o nivel

de medición. (En cuadros de diálogo con controles de clasificación de la lista de variables de origen, la

selección predefinida de Ninguna clasifica la lista por orden de archivos.)

Cuadro de diálogo con tamaño ajustado

Puede ajustar el tamaño de los cuadros de diálogo como si fueran ventanas, pulsando y arrastrando los

bordes o esquinas exteriores. Por ejemplo, si aumenta el ancho del cuadro de diálogo, las listas de

variables también serán más anchas.

Controles del cuadro de diálogo

Existen cinco controles estándares en la mayoría de los cuadros de diálogo:

Aceptar oEjecutar. Ejecuta el procedimiento. Después de seleccionar las variables y elegir las

especificaciones adicionales, pulse en Aceptar para ejecutar el procedimiento y cerrar el cuadro de

diálogo. Algunos cuadros de diálogo tienen un botón Ejecutar en lugar del botón Aceptar.

Pegar. Genera la sintaxis de comandos a partir de las selecciones del cuadro de diálogo y la pega en la

ventana de sintaxis. A continuación, puede personalizar los comandos con características adicionales que

no se encuentran disponibles en los cuadros de diálogo.

Restablecer. Desactiva las variables en las listas de variables seleccionadas y restablece todas las

especificaciones del cuadro de diálogo y los subcuadros de diálogo al estado predeterminado.

Cancelar. Cancela los cambios que se realizaron en las selecciones del cuadro de diálogo desde la última

vez que se abrió y lo cierra. Durante una sesión se mantienen las selecciones del cuadro de diálogo. El

cuadro de diálogo retiene el último conjunto de especificaciones hasta que se anulan.

Ayuda. Proporciona ayuda contextual. Este control le lleva a una ventana de Ayuda con información

sobre el cuadro de diálogo actual.

Seleccionar variables

Para seleccionar una única variable, simplemente selecciónela en la lista de variables de origen y

arrástrela y colóquela en la lista de variables de destino. También puede utilizar el botón de dirección

para mover las variables de la lista de origen a las listas de destino. Si sólo existe una lista de variables

de destino, puede pulsar dos veces en las variables individuales para desplazarlas desde la lista de origen

hasta la de destino.

También pueden seleccionar diversas variables:

vPara seleccionar varias variables que estén agrupadas en la lista de variables, pulse en la primera de

ellas y, a continuación, en la última del grupo mientras mantiene pulsada la tecla Mayús.

vPara seleccionar varias variables que no estén agrupadas en la lista de variables, pulse en la primera de

ellas; a continuación, pulse en la siguiente variable mientras mantiene pulsada la tecla Ctrl, y así

sucesivamente (en Macintosh, pulse mientras mantiene pulsada la tecla Comando).

Capítulo 1. Conceptos básicos 3

Iconos de tipo de datos, nivel de medición y lista de variables

Los iconos que se muestran junto a las variables en las listas de los cuadros de diálogo proporcionan

información acerca del tipo de variable y el nivel de medicións.

Tabla 1. Iconos de nivel de medición

Numérico Cadena Fecha Hora

Escala (Continuo) n/a

Ordinal

Nominal

vPara obtener más información sobre el nivel de medición, consulte “Nivel de medición de variable” en

la página 57.

vPara obtener más información sobre los tipos de datos numérico, cadena, fecha y hora, consulte “Tipo

de variable” en la página 58.

Información sobre las variables en un cuadro de diálogo

La mayoría de los cuadros de diálogo permiten conocer mejor las variables que se muestran en la lista de

variables.

1. Pulse con el botón derecho del ratón en la lista de variables de origen o de destino.

2. Seleccione Información sobre la variable.

Pasos básicos en el análisis de datos

Analizar datos con IBM SPSS Statistics es fácil. Simplemente tiene que:

Introducir los datos en IBM SPSS Statistics. Es posible abrir un archivo de datos IBM SPSS Statistics

previamente guardado, leer una hoja de cálculo, una base de datos o un archivo de datos de texto, o

introducir los datos directamente en el Editor de datos.

Seleccionar un procedimiento. Seleccione un procedimiento de los menús para calcular estadísticos o

crear un gráfico.

Seleccionar las variables para el análisis. Las variables del archivo de datos se muestran en un cuadro

de diálogo para el procedimiento.

Ejecute el procedimiento y observe los resultados. Los resultados se muestran en el Visor.

Asesor estadístico

Si no está familiarizado con IBM SPSS Statistics o con los procedimientos estadísticos disponibles, el

Asesor estadístico puede ayudarle solicitándole información mediante preguntas simples, utilizando un

lenguaje no técnico y ejemplos visuales que le ayudarán a seleccionar las características estadísticas y los

gráficos más apropiados para sus datos.

Para utilizar el Asesor estadístico, elija en los menús de cualquier ventana de IBM SPSS Statistics:

Ayuda >Asesor estadístico

4Guía del usuario de IBM SPSS Statistics 23 Core System

El Asesor estadístico cubre sólo un subconjunto selecto de procedimientos. Está diseñado para

proporcionar una asistencia general para muchas de las técnicas estadísticas básicas que se utilizan

habitualmente.

Información adicional

Si desea obtener una introducción global más detallada a los conceptos básicos, consulte el tutorial en

pantalla. En cualquier menú de IBM SPSS Statistics, elija:

Ayuda >Tutorial

Capítulo 1. Conceptos básicos 5

6Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 2. Obtención de ayuda

La ayuda se proporciona de diversas formas:

Menú Ayuda. En la mayoría de las ventanas, el menú Ayuda proporciona acceso al sistema de ayuda

principal además de a los tutoriales y al material de referencia técnica.

vTemas. Proporciona acceso a las pestañas Contenido, Índice y Buscar, que pueden usarse para buscar

temas específicos de la Ayuda.

vTutorial. Instrucciones ilustradas paso a paso sobre cómo utilizar muchas de las características básicas.

No necesita consultar el tutorial de principio a fin. Puede elegir los temas que desea consultar, pasar de

un tema a otro, ver los temas en cualquier orden y utilizar el índice o la tabla de contenidos para

buscar temas concretos.

vEstudios de casos. Ejemplos prácticos sobre cómo crear diferentes tipos de análisis estadísticos y cómo

interpretar los resultados. También se proporcionan los archivos de datos de muestra utilizados en

estos ejemplos para que pueda trabajar en dichos ejemplos y observar con exactitud cómo se generaron

los resultados. Puede elegir los procedimientos concretos que desee aprender en la tabla de contenidos

o buscar los temas correspondientes en el índice.

vAsesor estadístico. Método de asistencia para orientarle en el proceso de búsqueda del procedimiento

que desea utilizar. Tras realizar una serie de selecciones, el Asesor estadístico abre el cuadro de diálogo

para el procedimiento estadístico, de generación de informes o de creación de gráficos que cumple los

criterios seleccionados.

vReferencia de sintaxis de comandos La información detallada de la referencia de sintaxis de

comandos está disponible de dos maneras: integrada en el sistema de ayuda global y como un

documento independiente en formato PDF en la referencia de sintaxis de comandos (Command Syntax

Reference), disponible en el menú Ayuda.

vAlgoritmos de estadísticos. Los algoritmos utilizados para la mayor parte de los procedimientos

estadísticos están disponibles de dos formas: integrados en el sistema de ayuda global y como un

documento independiente en formato PDF, disponible en el CD de manuales. Para los enlaces a

algoritmos específicos en el sistema de ayuda, seleccione Algoritmos en el menú Ayuda.

Ayuda contextual. En muchos puntos de la interfaz de usuario, puede obtener ayuda sensible al contexto.

vBotón Ayuda en los cuadros de diálogo. La mayoría de los cuadros de diálogo disponen de un botón

Ayuda que permite acceder directamente al tema de ayuda correspondiente. Este tema proporciona

información general y enlaces a los temas relacionados.

vMenú emergente Ayuda de la tabla dinámica. Pulse con el botón derecho del ratón en los términos

de una tabla dinámica activada en el Visor y seleccione ¿Qué es esto? en el menú emergente para ver

las definiciones de los términos.

vSintaxis de comandos. En una ventana de sintaxis de comandos, coloque el cursor en cualquier punto

de un bloque de sintaxis para un comando y pulse F1 en el teclado. Se muestra un esquema de sintaxis

de comandos completo para dicho comando. La documentación completa sobre la sintaxis de

comandos está disponible en los enlaces de la lista de temas relacionados y en la pestaña Contenido de

la ayuda.

Otros recursos

Sitio Web del servicio técnico. Es posible encontrar las respuestas a los problemas más comunes en

http://www.ibm.com/support. (El sitio Web de servicio técnico requiere un ID de inicio de sesión y una

contraseña. La información sobre cómo obtener el ID y la contraseña se facilita en la dirección URL

mencionada anteriormente.)

Si usted es un estudiante que utiliza una versión académica o para estudiantes de cualquier producto de

software IBM SPSS, consulte nuestras páginas especiales en línea de Soluciones educativas para

estudiantes. Si usted es estudiante y utiliza una copia proporcionada por la universidad del software IBM

SPSS, póngase en contacto con el coordinador del producto IBM SPSS en su universidad.

Comunidad de SPSS. La comunidad de SPSS dispone de recursos para todos los niveles de usuarios y

desarrolladores de aplicaciones. Descargue utilidades, ejemplos de gráficos, nuevos módulos estadísticos

y artículos. Visite la comunidad de SPSS en http://www.ibm.com/developerworks/spssdevcentral..

Obtención de ayuda sobre los términos de los resultados

Para ver la definición de un término de los resultados de la tabla dinámica en el Visor:

1. Pulse dos veces en la tabla dinámica para activarla.

2. Pulse con el botón derecho del ratón en el término del que desee obtener información.

3. Seleccione ¿Qué es esto? en el menú emergente.

Aparecerá una definición del término en una ventana emergente.

Demostración

8Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 3. Archivos de datos

Los archivos de datos pueden tener formatos muy diversos, y este programa se ha sido diseñado para

trabajar con muchos de ellos, incluyendo:

vHojas de cálculo Excel

vTablas de base de datos de muchos orígenes de base de datos, incluidas Oracle, SQLServer, DB2 y otras

vDelimitado por tabuladores, CSV, y otros tipos de archivos de texto simples

vArchivos de datos de SAS

vArchivos de datos de Stata

Apertura de archivos de datos

Además de los archivos guardados en formato IBM SPSS Statistics, puede abrir archivos de Excel, SAS,

Stata, archivos delimitados por tabuladores y otros archivos sin necesidad de convertirlos a un formato

intermedio ni de introducir información sobre la definición de los datos.

vAbre un archivo de datos y lo convierte en el conjunto de datos activo. Si ya ha abierto uno o más

archivos de datos, permanecerán abiertos y disponibles para su uso posterior durante la sesión. Al

pulsar en cualquier punto de la ventana Editor de datos de un archivo de datos abierto lo convertirá

en el conjunto de datos activo. Consulte el tema Capítulo 6, “Trabajo con varios orígenes de datos”, en

la página 73 para obtener más información.

vEn el análisis en modo distribuido donde un servidor remoto procesa los comandos y ejecuta los

procedimientos, las unidades, carpetas y archivos de datos disponibles dependen de lo que esté

disponible en el servidor remoto. En la parte superior del cuadro de diálogo se indica el nombre del

servidor actual. Sólo tendrá acceso a los archivos de datos del equipo local si especifica la unidad como

un dispositivo compartido y las carpetas que contienen los archivos de datos como carpetas

compartidas. Consulte el tema Capítulo 4, “Análisis en modo distribuido”, en la página 49 para obtener

más información.

Para abrir archivos de datos

1. Elija en los menús:

Archivo >Abrir >Datos...

2. En el cuadro de diálogo Abrir datos, seleccione el archivo que desea abrir.

3. Pulse en Abrir.

Si lo desea, puede:

vEstablecer de forma automática la longitud de cada variable de cadena en el valor más largo observado

para dicha variable mediante Minimizar longitudes de cadena en función de los valores observados.

Esto es especialmente útil cuando se leen archivos de datos de página de código en modo Unicode.

Consulte el tema “Opciones generales” en la página 217 para obtener más información.

vLeer los nombres de las variables de la primera fila de los archivos de hoja de cálculo.

vEspecificar el rango de casillas que desee leer en los archivos de hojas de cálculo.

vEspecificar una hoja de trabajo dentro de un archivo de Excel que desee leer (Excel 95 o versiones

posteriores).

Para obtener información sobre la lectura de datos de bases de datos, consulte “Lectura de archivos de

bases de datos” en la página 12. Para obtener información sobre la lectura de datos de archivos de datos

de texto, consulte “Asistente para texto” en la página 18. Para obtener información sobre la lectura de

datos de IBM Cognos, consulte “Lectura de datos de Cognos BI” en la página 22.

Tipos de archivos de datos

SPSS Statistics. Abre archivos de datos que se guardan en el formato de IBM SPSS Statistics y también el

producto SPSS/PC+ para DOS.

SPSS Statistics comprimido. Abre archivos de datos que se guardan en el formato comprimido de IBM

SPSS Statistics.

SPSS/PC+. Abre archivos de datos de SPSS/PC+. Esta opción sólo está disponible en los sistemas

operativos Windows.

Portátil. Abre archivos de datos que se guardan en formato portátil. El almacenamiento de archivos en

este formato lleva mucho más tiempo que guardarlos en formato IBM SPSS Statistics.

Excel. Abre archivos de Excel.

Lotus 1-2-3. Abre archivos de datos que se guarda en formato 1-2-3 para el release 3.0, 2.0, o 1A de Lotus.

SYLK. Abre archivos de datos que se guardan en formato SYLK (enlace simbólico), un formato que

utilizan algunas aplicaciones de hoja de cálculo.

dBASE. Abre archivos con formato dBASE para dBASE IV, dBASE III o III PLUS, o dBASE II. Cada caso

es un registro. Las etiquetas de valor y de variable y las especificaciones de valores perdidos se pierden si

se guarda un archivo en este formato.

SAS. Versiones 6-9 de SAS y archivos de transporte SAS.

Stata. Stata versiones 4–13.

Opciones de apertura de archivos

Leer los nombres de variable. En las hojas de cálculo, puede leer los nombres de variable de la primera

fila del archivo o de la primera fila del rango definido. Los valores se convertirán según sea preciso para

crear nombres de variables válidos, incluyendo la conversión de espacios en subrayados.

Hoja de trabajo. Los archivos de Excel 95 o de versiones posteriores pueden contener varias hojas de

trabajo. El Editor de datos lee de forma predeterminada la primera hoja. Para leer una diferente,

seleccione la que desee en la lista desplegable.

Rango. En los archivos de hoja de cálculo, también puede leer un rango de casillas. Para especificar

rangos de casillas utilice el mismo método que empleará en la aplicación de hoja de cálculo.

Lectura de archivos de Excel

Lectura de archivos de Excel 95 o versiones posteriores

Las normas siguientes se aplican al leer archivos de Excel 95 o posteriores:

Tipo y ancho de datos. Cada columna es una variable. El tipo de datos y el ancho de cada variable está

determinado por el tipo de datos y el ancho en el archivo de Excel. Si la columna contiene más de un

tipo de datos (por ejemplo, fecha y numérico), el tipo de datos se define como cadena y todos los valores

se leen como valores de cadena válidos.

Casillas en blanco. En las variables numéricas, las casillas en blanco se convierten en el valor perdido del

sistema indicado por un punto (o una coma). En las variables de cadena, los espacios en blanco son

valores de cadena válidos y las casillas en blanco se tratan como valores de cadena válidos.

10 Guía del usuario de IBM SPSS Statistics 23 Core System

Nombres de variables. Si lee la primera fila del archivo de Excel (o la primera fila del rango

especificado) como nombres de variable, los valores que no cumplan las normas de denominación de

variables se convertirán en nombres de variables válidos y los nombres originales se utilizarán como

etiquetas de variable. Si no lee nombres de variable del archivo de Excel, se asignarán nombres de

variable predeterminados.

Lectura de archivos de Excel y otras hojas de cálculo de versiones

Las siguientes normas se aplican para leer archivos de Excel de versiones anteriores a Excel 95 y otros

datos de hoja de cálculo:

Tipo y ancho de datos. El tipo y el ancho de los datos para cada variable se determinan según el ancho

de la columna y el tipo de datos de la primera casilla de la columna. Los valores de otro tipo se

convierten en valor perdido del sistema. Si la primera casilla de datos de la columna está en blanco, se

utiliza el tipo de datos global predeterminado para la hoja de cálculo (normalmente numérico).

Casillas en blanco. En las variables numéricas, las casillas en blanco se convierten en el valor perdido del

sistema indicado por un punto (o una coma). En las variables de cadena, los espacios en blanco son

valores de cadena válidos y las casillas en blanco se tratan como valores de cadena válidos.

Nombres de variables. Si no se leen los nombres de variable de la hoja de cálculo, se utilizan las letras

de las columnas (A,B,C,...) como nombres de variable de los archivos de Excel y de Lotus. Para los

archivos de SYLK y de Excel guardados en el formato de presentación R1C1, el programa utiliza para los

nombres de variable el número de la columna precedido por la letra C(C1,C2,C3,...).

Lectura de archivos de dBASE

Los archivos de bases de datos son, lógicamente, muy similares a los archivos de datos con formato IBM

SPSS Statistics. Las siguientes normas generales se aplican a los archivos de dBASE:

vLos nombres de campo se convierten en nombres de variable válidos.

vLos dos puntos en los nombres de campo de dBASE se convierten en subrayado.

vSe incluyen los registros marcados para ser eliminados que aún no se han purgado. El programa crea

una nueva variable de cadena, D_R, que incluye un asterisco en los casos marcados para su

eliminación.

Lectura de archivos de Stata

Las siguientes normas generales se aplican a los archivos de Stata:

vNombres de variables. Los nombres de variable de Stata se convierten en nombres de variable de IBM

SPSS Statistics en formato que distingue entre mayúsculas y minúsculas. Los nombres de variable de

Stata que sólo se diferencian en el uso de las mayúsculas y minúsculas se convierten en nombres de

variable válidos añadiendo un subrayado y una letra secuencial (_A,_B,_C, ..., _Z,_AA,_AB, ..., etc.).

vEtiquetas de variable. Las etiquetas de variable de Stata se convierten en etiquetas de variable de IBM

SPSS Statistics.

vEtiquetas de valor. Las etiquetas de valor de Stata se convierten en etiquetas de valor de IBM SPSS

Statistics, excepto las etiquetas de valor de Stata asignadas a valores perdidos "extendidos". Las

etiquetas de valor con más de 120 bytes de longitud se truncan.

vVariables de cadena. Las variables Stata strl se convierten a variables de cadena. Los valores con una

longitud superior a 32K bytes se truncan. Los valores Stata strl que contiene objetos grandes binarios

(blobs) se convierten a cadenas en blanco.

vValores perdidos. Los valores perdidos "extendidos" de Stata se convierten en valores perdidos del

sistema.

vConversión de fechas. Los valores de formato de fecha de Stata se convierten en valores con formato

DATE (d-m-a) de IBM SPSS Statistics. Los valores de formato de fecha de "serie temporal" de Stata

Capítulo 3. Archivos de datos 11

(semanas, meses, trimestres, etc.) se convierten a formato numérico simple (F), conservando el valor

entero interno original, que es el número de semanas, meses, trimestres, etc., desde el inicio de 1960.

Lectura de archivos de bases de datos

Podrá leer los datos desde cualquier formato de base de datos para los que disponga de un controlador

de base de datos. En el análisis en modo local, los controladores necesarios deben estar instalados en el

ordenador local. En el análisis en modo distribuido (disponible con IBM SPSS Statistics Server), los

controladores deben estar instalados en el servidor remoto. Consulte el tema Capítulo 4, “Análisis en

modo distribuido”, en la página 49 para obtener más información.

Nota: si tiene la versión de IBM SPSS Statistics para Windows de 64 bits, no podrá leer orígenes de bases

de datos Excel, Access o dBASE, aunqie pueden aparecer en la lista de orígenes de bases de datos

disponibles. Los controladores de ODBC de 32 bits de estos productos no son compatibles.

Para leer archivos de base de datos

1. Elija en los menús:

Archivo >Abrir base de datos >Nueva consulta...

2. Seleccione el origen de datos.

3. Si es necesario (según el origen de datos), seleccione el archivo de base de datos y/o escriba un

nombre de acceso, contraseña y demás información.

4. Seleccione las tablas y los campos. Para los orígenes de datos OLE DB (sólo disponibles en los

sistemas operativos Windows), únicamente puede seleccionar una tabla.

5. Especifique cualquier relación existente entre las tablas.

6. Si lo desea:

vEspecifique cualquier criterio de selección para los datos.

vAñada un mensaje solicitando al usuario que introduzca datos para crear una consulta con parámetros.

vGuarde la consulta creada antes de ejecutarla.

Agrupación de conexiones

Si accede al mismo origen de base de datos varias veces en la misma sesión o trabajo, puede mejorar el

rendimiento con la agrupación de conexiones.

1. En el último paso del asistente, pegue la sintaxis del comando en una ventana de sintaxis.

2. Al final de la cadena entrecomillada CONNECT, añada Pooling=true.

Para editar una consulta de base de datos guardada

1. Elija en los menús:

Archivo >Abrir base de datos >Editar consulta...

2. Seleccione el archivo de consulta (*.spq) que desee editar.

3. Siga las instrucciones para crear una consulta.

Para leer archivos de bases de datos con una consulta ODBC guardada

1. Elija en los menús:

Archivo >Abrir base de datos >Ejecutar consulta...

2. Seleccione el archivo de consulta (*.spq) que desee ejecutar.

3. Si es necesario (según el archivo de base de datos), introduzca un nombre de acceso y una contraseña.

4. Si la consulta tiene una solicitud incrustada, introduzca otra información necesaria (por ejemplo, el

trimestre para el que desee obtener cifras de ventas).

12 Guía del usuario de IBM SPSS Statistics 23 Core System

Selección de un origen de datos

Utilice la primera pantalla del Asistente para bases de datos para seleccionar el tipo de origen de datos

que se leerá.

Orígenes de datos ODBC

Si no tiene configurado ningún origen de datos ODBC o si desea añadir uno nuevo, pulse en Añadir

origen de datos ODBC.

vEn los sistemas operativos Linux, este botón no está disponible. Los orígenes de datos ODBC se

especifican en odbc.ini y es necesario especificar las variables de entorno ODBCINI con la ubicación de

dicho archivo. Si desea obtener más información, consulte la documentación de los controladores de la

base de datos.

vEn el análisis en modo distribuido (disponible con IBM SPSS Statistics Server), este botón no está

disponible. Para añadir orígenes de datos en el análisis en modo distribuido, consulte con el

administrador del sistema.

Un origen de datos ODBC está compuesto por dos partes esenciales de información: el controlador que se

utilizará para acceder a los datos y la ubicación de la base de datos a la que se desea acceder. Para

especificar los orígenes de datos, deberán estar instalados los controladores adecuados. El soporte de

instalación incluye controladores de una gran variedad de formatos de base de datos .

Para acceder a los orígenes de datos OLE DB (sólo disponibles en los sistemas operativos Windows), debe

tener instalados los siguientes elementos:

v.NET framework. Para obtener la versión más reciente de .NET framework, vaya a

http://www.microsoft.com/net.

vIBM SPSS Data Collection Survey Reporter Developer Kit. Para obtener información sobre la obtención

de una versión compatible de IBM SPSS Data Collection Survey Reporter Developer Kit, visite

www.ibm.com/support.

Las siguientes limitaciones son aplicables a los orígenes de datos de OLE DB:

vLas uniones entre tablas no están disponibles para los orígenes de datos OLE DB. Sólo se puede leer

una tabla al mismo tiempo.

vSe pueden añadir orígenes de datos OLE DB en análisis en modo local. Para añadir orígenes de datos

OLE DB en el análisis en modo distribuido en un servidor Windows, consulte con el administrador del

sistema.

vEn el análisis en modo distribuido (disponible con IBM SPSS Statistics Server), los orígenes de datos

OLE DB sólo están disponibles en servidores Windows, y debe tener instalado en el servidor .NET y

IBM SPSS Data Collection Survey Reporter Developer Kit.

Para añadir un origen de datos OLE DB:

1. Pulse en Añadir origen de datos OLE DB.

2. En las propiedades del enlace de datos, pulse en la pestaña Proveedor y seleccione el proveedor OLE

DB.

3. Pulse en Siguiente o en la pestaña Conexión.

4. Seleccione la base de datos introduciendo la ubicación del directorio y el nombre de base de datos o

pulsando en el botón para desplazarse hasta una base de datos. (Puede que también sean necesarios

un nombre de usuario y una contraseña.)

5. Pulse en Aceptar una vez que haya escrito toda la información necesaria. (Puede comprobar si la base

de datos especificada está disponible pulsando en el botón Probar conexión.)

6. Escriba un nombre para la información de conexión de base de datos. (Este nombre se mostrará en la

lista de orígenes de datos OLE DB disponibles.)

Capítulo 3. Archivos de datos 13

7. Pulse en Aceptar.

Volverá a la primera pantalla del Asistente para bases de datos, donde puede seleccionar el nombre

guardado de la lista de orígenes de datos OLE DB y continuar con el siguiente paso del asistente.

Eliminación de orígenes de datos OLE DB

Para eliminar nombres de orígenes de datos de la lista de orígenes de datos OLE DB, elimine el archivo

UDL que contiene el nombre del origen de datos:

[unidad]:\Documents and Settings\[nombre de usuario]\Local Settings\Application Data\SPSS\UDL

Selección de campos de datos

El paso de selección de datos controla las tablas y los campos que se deben leer. Los campos (las

columnas) de la base de datos se leen como variables.

Si una tabla tiene un campo cualquiera seleccionado, todos sus campos serán visibles en las ventanas

subsiguientes del Asistente para bases de datos; sin embargo, sólo se importarán como variables los

campos seleccionados en este paso. Esto le permitirá crear uniones entre tablas y especificar criterios

empleando los campos que no esté importando.

Presentación de los nombres de los campos. Para ver los campos de la tabla, pulse en el signo más (+)

situado a la izquierda del nombre de una tabla. Para ocultar los campos pulse en el signo menos (-)

situado a la izquierda del nombre de una tabla.

Para añadir un campo. Pulse dos veces en cualquier campo de la lista Tablas disponibles o arrástrelo

hasta la lista Recuperar los campos en este orden. Los campos se pueden volver a ordenar arrastrándolos

y colocándolos dentro de la lista de campos.

Para eliminar un campo. Pulse dos veces en cualquier campo de la lista Recuperar los campos en este

orden, o bien arrástrelo hasta la lista Tablas disponibles.

Ordenar los nombres de campo. Si se selecciona, el Asistente para bases de datos mostrará los campos

disponibles en orden alfabético.

De forma predeterminada, la lista muestra sólo las tablas disponibles de bases de datos estándar. Puede

controlar el tipo de elementos que se muestran en la lista:

vTablas. Tablas de base de datos estándar.

vVistas. Las vistas son "tablas" virtuales o dinámicas definidas por consultas. Estas tablas pueden

incluir uniones de varias tablas y/o campos derivados de cálculos basados en los valores de otros

campos.

vSinónimos. Un sinónimo es un alias para una tabla o vista que suele estar definido en una consulta.

vTablas del sistema. Las tablas del sistema definen propiedades de la base de datos. En algunos casos,

las tablas de base de datos estándar pueden estar clasificadas como tablas del sistema y sólo se

mostrarán si se selecciona esta opción. El acceso a tablas del sistema reales suele estar limitado a los

administradores de la base de datos.

Nota: para los orígenes de datos OLE DB (sólo disponibles en los sistemas operativos Windows),

únicamente puede seleccionar los campos de una sola tabla. Las uniones entre varias tablas no son

compatibles con los orígenes de datos OLE DB.

Creación de una relación entre tablas

El paso Especificar relaciones permite definir relaciones entre las tablas para orígenes de datos ODBC. Si

selecciona campos de más de una tabla, deberá definir al menos una unión.

14 Guía del usuario de IBM SPSS Statistics 23 Core System

Establecimiento de relaciones. Para crear una relación, arrastre un campo desde cualquier tabla hasta el

campo con el que quiera unirlo. El Asistente para bases de datos dibujará una línea de unión entre los

dos campos que indica su relación. Estos campos deben ser del mismo tipo de datos.

Unir tablas automáticamente. Intenta unir las tablas automáticamente en función de las claves

primarias/externas o de los nombres de campo y tipos de datos coincidentes.

Tipo de unión Si el controlador permite uniones exteriores, podrá especificar uniones interiores, uniones

exteriores izquierdas o uniones exteriores derechas.

vUniones interiores. Una unión interior incluye sólo las filas donde los campos relacionados son

iguales. En este ejemplo, se incluirán todas las filas con los mismos valores de ID.

vUniones exteriores. Además de las coincidencias de uno a uno con uniones interiores, también puede

utilizar uniones exteriores para fusionar tablas con un esquema de coincidencia de uno a varios. Por

ejemplo, puede hacer una coincidencia con una tabla donde sólo hay algunos registros que representan

los valores de datos y las etiquetas descriptivas asociadas, con valores en una tabla que contiene

cientos o miles de registros que representan los encuestados. Una unión exterior izquierda incluye

todos los registros de la tabla izquierda y sólo aquellos registros de la tabla derecha en los que los

campos relacionados son iguales. En una unión exterior derecha, se importan todos los registros de la

tabla derecha y sólo aquellos registros de la tabla izquierda en los que los campos relacionados son

iguales.

Cálculo de nuevos campos

Si está en modalidad distribuida, conectado a un servidor remoto (disponible con IBM SPSS Statistics

Server), podrá calcular nuevos campos antes de leer los datos en IBM SPSS Statistics.

También puede calcular nuevos campos después de leer los datos en IBM SPSS Statistics, pero si calcula

nuevos campos en la base de datos ahorrará tiempo en el caso de orígenes de datos de gran tamaño.

Nuevo nombre de campo. El nombre debe cumplir con las reglas de nombres de IBM SPSS Statistics.

Expresión. Escriba la expresión para calcular el nuevo campo. Puede arrastrar los nombres de campo

existentes a la lista Campos y las funciones desde la lista Funciones.

Limitar la recuperación de casos

Este paso permite especificar el criterio para seleccionar subconjuntos de casos (filas). La limitación de los

casos consiste generalmente en rellenar la cuadrícula de criterios con uno o varios criterios. Los criterios

constan de dos expresiones y de alguna relación entre ellas, y devuelven un valor verdadero,falso operdido

para cada caso.

vSi el resultado es verdadero, se selecciona el caso.

vSi el resultado es falso operdido, no se selecciona el caso.

vLa mayoría de los criterios utiliza al menos uno de los seis operadores de relación (<, >, <=, >=, = y

<>).

vLas expresiones pueden incluir nombres de campo, constantes, operadores aritméticos, funciones

numéricas y de otros tipos, y variables lógicas. Puede utilizar como variables los campos que no vaya a

importar.

Para crear sus criterios necesita por lo menos dos expresiones y una relación para conectarlas.

1. Para crear una expresión, seleccione uno de los siguientes métodos:

vEn una casilla Expresión, puede escribir nombres de campo, constantes, operadores aritméticos,

funciones numéricas y de otro tipo, y variables lógicas.

vPulse dos veces en el campo de la lista Campos.

vArrastre el campo de la lista Campos hasta la casilla Expresión.

vSeleccione un campo del menú desplegable en una casilla Expresión activa.

Capítulo 3. Archivos de datos 15

2. Para elegir el operador relacional (como = o >), sitúe el cursor en la casilla Relación y escriba el tipo

de operador o selecciónelo en el menú desplegable.

Si SQL contiene las cláusulas WHERE con expresiones para la selección de casos, las fechas y las horas

de las expresiones deberán especificarse de un modo especial (incluidas las llaves que se muestran en

los ejemplos:)

vLos literales de fecha deben especificarse usando el formato general {d ’aaaa-mm-dd’}.

vLos literales de hora deben especificarse usando el formato general {t ’hh:mm:ss’}.

vLos literales de fecha y hora (marcas de hora) se deben especificar usando el formato general {ts

’aaaa-mm-dd hh:mm:ss’}.

vEl valor completo de fecha y/o hora debe ir entre comillas simples. Los años se deben expresar en

formato de cuatro dígitos y las fechas y horas deben contener dos dígitos para cada parte del valor.

Por ejemplo, 1 de enero de 2005, 1:05 AM se expresaría como:

{ts ’2005-01-01 01:05:00’}

Funciones. Se ofrece una selección de funciones preincorporadas SQL aritméticas, lógicas, de cadena,

de fecha y de hora. Puede arrastrar una función de la lista hasta la expresión, o introducir una

función SQL válida. Consulte la documentación de la base de datos para obtener funciones SQL

válidas. Hay una lista de funciones estándar disponibles en:

Utilizar muestreo aleatorio. Esta opción selecciona una muestra aleatoria de casos del origen de

datos. Para grandes orígenes de datos, es posible que desee limitar el número de casos a una pequeña

y representativa muestra, lo que reduce considerablemente el tiempo de ejecución de procesos. Si el

muestreo aleatorio original se encuentra disponible para el origen de datos, resulta más rápido que el

muestreo aleatorio de IBM SPSS Statistics dado que IBM SPSS Statistics aún debe leer todo el origen

de datos para extraer una muestra aleatoria.

vAproximadamente. Genera una muestra aleatoria con el porcentaje aproximado de casos indicado.

Dado que esta rutina toma una decisión pseudoaleatoria para cada caso, el porcentaje de casos

seleccionados sólo se puede aproximar al especificado. Cuantos más casos contenga el archivo de

datos, más se acercará el porcentaje de casos seleccionados al porcentaje especificado.

vExactamente. Selecciona una muestra aleatoria con el número de casos especificado a partir del

número total de casos especificado. Si el número total de casos especificado supera el número total

de casos presentes en el archivo de datos, la muestra contendrá un número menor de casos

proporcional al número solicitado.

Nota: si utiliza el muestreo aleatorio, agregación (disponible en el modo distribuido con IBM SPSS

Statistics Server) no estará disponible.

Pedir el valor al usuario. Permite insertar una solicitud en la consulta para crear una consulta con

parámetros. Cuando un usuario ejecute la consulta, se le solicitará que introduzca los datos (según lo

que se haya especificado aquí). Puede interesarle esta opción si necesita obtener diferentes vistas de

los mismos datos. Por ejemplo, es posible que desee ejecutar la misma consulta para ver las cifras de

ventas de diversos trimestres fiscales.

3. Sitúe el cursor en cualquier casilla de expresión y pulse en Pedir el valor al usuario para crear una

petición.

Creación de una consulta con parámetros

Utilice el paso Pedir el valor al usuario para crear un cuadro de diálogo que solicite información al

usuario cada vez que ejecute su consulta. Esta característica resulta útil para realizar consultas de un

mismo origen de datos empleando criterios diferentes.

Para crear una solicitud, introduzca una cadena de petición y un valor predeterminado. Esta cadena

aparecerá cada vez que un usuario ejecute la consulta. La cadena especificará el tipo de información que

debe introducir. Si la información no se ofrece en una lista, la cadena sugerirá el formato que debe

aplicarse a la información. El siguiente es un ejemplo: Introduzca un trimestre (Q1, Q2, Q3, ...).

16 Guía del usuario de IBM SPSS Statistics 23 Core System

Permitir al usuario seleccionar el valor de la lista. Si selecciona esta casilla de verificación, puede limitar

las elecciones del usuario a los valores que incluya en esta lista. Asegúrese de que los valores se separan

por retornos de carro.

Tipo de datos. Seleccione aquí el tipo de datos (Número,Cadena oFecha).

Los valores de fecha y hora deberán especificarse de manera especial:

vLos valores de fecha deben utilizar el formato general aaaa-mm-dd.

vLos valores de hora deben utilizar el formato general: hh:mm:ss.

vLos valores de fecha/hora (marcas de tiempo) deben utilizar el formato general aaaa-mm-dd hh:mm:ss.

Adición de Datos

Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con el servidor IBM

SPSS Statistics), podrá agregar los datos antes de leerlos en IBM SPSS Statistics.

También se pueden agregar los datos después de leerlos en IBM SPSS Statistics, pero si lo hace antes

ahorrará tiempo en el caso de grandes orígenes de datos.

1. Para crear datos agregados, seleccione una o más variables de segmentación que definan cómo deben

agruparse los casos.

2. Seleccione una o varias variables agregadas.

3. Seleccione una función de agregación para cada variable agregada.

4. Si lo desea, cree una variable que contenga el número de casos en cada grupo de segmentación.

Nota: si utiliza el muestreo aleatorio de IBM SPSS Statistics, la agregación no estará disponible.

Definición de variables

Nombres y etiquetas de variables. El nombre completo del campo (columna) de la base de datos se

utiliza como etiqueta de la variable. A menos que modifique el nombre de la variable, el Asistente para

bases de datos asignará nombres de variable a cada columna de la base de datos de una de las siguientes

formas:

vSi el nombre del campo de la base de datos forma un nombre de variable válido y exclusivo, se usará

como el nombre de la variable.

vSi el nombre del campo de la base de datos no es un nombre de variable válido y exclusivo, se

generará automáticamente un nombre único.

Pulse en cualquier casilla para editar el nombre de la variable.

Conversión de cadenas en variables numéricas. Seleccione la casilla Recodificar como numérica para

convertir automáticamente una variable de cadena en una variable numérica. Los valores de cadena se

convierten en valores enteros consecutivos en función del orden alfabético de los valores originales. Los

valores originales se mantienen como etiquetas de valor para las nuevas variables.

Anchura para los campos de ancho variable. Esta opción controla la anchura de los valores de las

cadenas de anchura variable. De forma predeterminada, la anchura es de 255 bytes y sólo se leen los

primeros 255 bytes (generalmente 255 caracteres en idiomas de un solo byte). El valor máximo que se

puede asignar a este parámetro es de 32.767 bytes. Aunque posiblemente no desee truncar los valores de

cadena, tampoco deseará especificar un valor innecesariamente alto, ya que produciría que el

procesamiento fuera ineficaz.

Minimizar las longitudes de cadena en función de los valores observados. Establece automáticamente

el ancho de cada variable de cadena al valor observado más largo.

Capítulo 3. Archivos de datos 17

Ordenación de casos

Si se encuentra en modo distribuido, conectado a un servidor remoto (disponible con IBM SPSS Statistics

Server), podrá agregar los datos antes de leerlos en IBM SPSS Statistics.

También se pueden ordenar los datos después de leerlos en IBM SPSS Statistics, pero si lo hace antes

ahorrará tiempo en el caso de grandes orígenes de datos.

Resultados

El paso Resultados muestra la sentencia Select de SQL para la consulta.

vSe puede editar la sentencia Select de SQL antes de ejecutar la consulta, pero si pulsa el botón Anterior

para introducir cambios en pasos anteriores, se perderán los cambios realizados en la sentencia Select.

vPara guardar la consulta para utilizarla más adelante, utilice la sección Guardar la consulta en un

archivo.

vPara pegar la sintaxis GET DATA completa en una ventana de sintaxis, seleccione Pegarlo en el editor de

sintaxis para su modificación ulterior. Copiar y pegar la sentencia Select de la ventana Resultados no

pegará la sintaxis de comandos necesaria.

Nota: La sintaxis pegada contiene un espacio en blanco delante de las comillas de cierre en cada línea de

SQL generada por el asistente. Estos espacios no son superfluos. Cuando se procesa el comando, todas las

líneas de la sentencia SQL se fusionan de un modo muy literal. Si esos espacios, los caracteres último y

primero de cada línea se unirían.

Asistente para texto

El Asistente para la importación de texto puede leer archivos de datos de texto de diversos formatos:

vArchivos delimitados por tabuladores

vArchivos delimitados por espacios

vArchivos delimitados por comas

vArchivos con formato de campos fijos

En los archivos delimitados, también se pueden especificar otros caracteres como delimitadores entre

valores, o bien especificar varios delimitadores diferentes.

Para leer archivos de datos de texto

1. Elija en los menús:

Archivo >Leer datos de texto...

2. Seleccione el archivo de texto en el cuadro de diálogo Abrir datos.

3. En caso necesario, seleccione la codificación del archivo.

4. Siga los pasos indicados en el Asistente para la importación de texto para definir cómo desea leer el

archivo de datos de texto.

Demostración

Codificación

La codificación de un archivo afecta a la forma como se leen los datos de carácter. Los archivos de datos

Unicode normalmente contienen una marca de orden de byte que identifica la codificación de caracteres.

Algunas aplicaciones crean archivos Unicode sin una marca de orden de byte y los archivos de datos de

páginas de códigos no contienen ningún identificador de codificación.

vUnicode (UTF-8). Lee el archivo como Unicode UTF-8.

vUnicode (UTF-16). Lee el archivo como Unicode UTF-16 en la alineación del sistema operativo.

vUnicode (UTF-16BE). Lee el archivo como Unicode UTF-16, big endian.

vUnicode (UTF-16LE). Lee el archivo como Unicode UTF-16, little endian.

18 Guía del usuario de IBM SPSS Statistics 23 Core System

vCodificación local. Lee el archivo en la codificación de caracteres de la página de códigos del entorno

local actual.

Si un archivo contiene una marca de orden de byte Unicode, se lee en la codificación Unicode,

independientemente de la codificación que seleccione. Si un archivo no contiene una marca de orden de

byte Unicode, de forma predeterminada, se presupone que la codificación es la codificación de caracteres

de la página de códigos del entorno local actual, a menos que seleccione una de las codificaciones

Unicode.

Para cambiar el entorno local actual para archivos de datos en una codificación de caracteres de página

de códigos diferente, seleccione Editar>Opciones en los menús y cambie el entorno local en la pestaña

Idioma.

Asistente para la importación de texto: paso 1

El archivo de texto se mostrará en una ventana de vista previa. Puede aplicar un formato predefinido

(guardado con anterioridad desde el Asistente para la importación de texto) o seguir los pasos del

asistente para especificar cómo desea que se lean los datos.

Asistente para la importación de texto: paso 2

Este paso ofrece información sobre las variables. Una de las variables es similar a uno de los campos de

la base de datos. Por ejemplo, cada elemento de un cuestionario es una variable.

¿Cómo están organizadas sus variables? Para leer los datos adecuadamente, el Asistente para la

importación de texto necesita saber cómo determinar el lugar en el que terminan los valores de datos de

una variable y comienzan los valores de datos de la variable siguiente. La organización de las variables

define el método utilizado para diferenciar una variable de la siguiente.

vDelimitado. Se utilizan espacios, comas, tabulaciones u otros caracteres para separar variables. Las

variables quedan registradas en el mismo orden para cada caso, pero no necesariamente conservando

la misma ubicación para las columnas.

vAncho fijo. Cada variable se registra en la misma posición de columna en el mismo registro (línea)

para cada caso del archivo de datos. No se requiere delimitador entre variables De hecho, en muchos

archivos de datos de texto generados por programas de ordenador, podría parecer que los valores de

los datos se suceden, sin espacios que los separen. La ubicación de la columna determina qué variable

se está leyendo.

Nota: el Asistente para la importación de texto no puede leer archivos de texto Unicode de ancho fijo.

Puede utilizar el comando DATA LIST para leer archivos Unicode de ancho fijo.

¿Están incluidos los nombres de las variables en la parte superior del archivo? Si la primera fila del

archivo de datos contiene etiquetas descriptivas para cada variable, podrá utilizar dichas etiquetas como

nombres de las variables. Los valores que no cumplan las normas de denominación de variables se

convertirán en nombres de variables válidos.

Asistente para la importación de texto: paso 3 (archivos delimitados)

Este paso ofrece información sobre los casos. Un caso es similar a un registro de una base de datos. Por

ejemplo, cada persona que responde a un cuestionario es un caso.

¿En qué número de línea comienza el primer caso de datos? Indica la primera línea del archivo de datos

que contiene valores de datos. Si la línea o líneas superiores del archivo de datos contienen etiquetas

descriptivas o cualquier otro texto que no represente valores de datos, dicha línea o líneas no serán la

línea 1.

¿Cómo se representan sus casos? Controla la manera en que el Asistente para la importación de texto

determina dónde finaliza cada caso y comienza el siguiente.

vCada línea representa un caso. Cada línea contiene un sólo caso. Es bastante común que cada línea

(fila) contenga un sólo caso, aunque dicha línea puede ser muy larga para un archivo de datos con un

Capítulo 3. Archivos de datos 19

gran número de variables. Si no todas las líneas contienen el mismo número de valores de datos, el

número de variables para cada caso quedará determinado por la línea que tenga el mayor número de

valores de datos. A los casos con menos valores de datos se les asignarán valores perdidos para las

variables adicionales.

vUn número concreto de variables representa un caso. El número de variables especificado para cada

caso informa al Asistente para la importación de texto de dónde detener la lectura de un caso y

comenzar la del siguiente. Una misma línea puede contener varios casos y los casos pueden empezar

en medio de una línea y continuar en la línea siguiente. El Asistente para la importación de texto

determina el final de cada caso basándose en el número de valores leídos, independientemente del

número de líneas. Cada caso debe contener valores de datos (o valores perdidos indicados por

delimitadores) para todas las variables; de otra forma, el archivo de datos no se leerá correctamente.

¿Cuántos casos desea importar? Puede importar todos los casos del archivo de datos, los primeros n

casos (siendo nun número especificado por el usuario) o una muestra aleatoria a partir de un porcentaje

especificado. Dado que esta rutina de muestreo aleatorio toma una decisión pseudo-aleatoria para cada

caso, el porcentaje de casos seleccionados sólo se puede aproximar al porcentaje especificado. Cuantos

más casos contenga el archivo de datos, más se acercará el porcentaje de casos seleccionados al porcentaje

especificado.

Asistente para la importación de texto: paso 3 (archivos de ancho fijo)

Este paso ofrece información sobre los casos. Un caso es similar a un registro de una base de datos. Por

ejemplo, cada encuestado es un caso.

¿En qué número de línea comienza el primer caso de datos? Indica la primera línea del archivo de datos

que contiene valores de datos. Si la línea o líneas superiores del archivo de datos contienen etiquetas

descriptivas o cualquier otro texto que no represente valores de datos, dicha línea o líneas no serán la

línea 1.

¿Cuántas líneas representan un caso? Controla la manera en que el Asistente para la importación de

texto determina dónde finaliza cada caso y comienza el siguiente. Cada variable queda definida por su

número de línea dentro del caso y por la ubicación de su columna. Para leer los datos correctamente,

deberá especificar el número de líneas de cada caso.

¿Cuántos casos desea importar? Puede importar todos los casos del archivo de datos, los primeros n

casos (siendo nun número especificado por el usuario) o una muestra aleatoria a partir de un porcentaje

especificado. Dado que esta rutina de muestreo aleatorio toma una decisión pseudo-aleatoria para cada

caso, el porcentaje de casos seleccionados sólo se puede aproximar al porcentaje especificado. Cuantos

más casos contenga el archivo de datos, más se acercará el porcentaje de casos seleccionados al porcentaje

especificado.

Asistente para la importación de texto: paso 4 (archivos delimitados)

Este paso muestra la mejor opción, según el Asistente para la importación de texto, para leer el archivo

de datos y le permite modificar la manera en que el asistente leerá las variables del archivo de datos.

¿Qué delimitador desea para la separación entre variables? Indica los caracteres o símbolos que separan

los valores de datos. Puede seleccionar cualquier combinación de espacios, comas, signos de punto y

coma, tabulaciones o cualquier otro carácter. En caso de existir varios delimitadores consecutivos sin

valores de datos, dichos delimitadores serán considerados valores perdidos.

¿Cuál es el calificador de texto? Caracteres utilizados para encerrar valores que contienen caracteres

delimitadores. Por ejemplo, si una coma es el delimitador, los valores que contengan comas se leerán

incorrectamente a menos que estos valores se encierre en un calificador de texto, impidiendo que las

comas del valor se interpreten como delimitadores entre los valores. Los archivos de datos con formato

CSV de Excel utilizan las comillas dobles (") como calificador de texto. El calificador de texto aparece

tanto al comienzo como al final del valor, encerrándolo completamente.

20 Guía del usuario de IBM SPSS Statistics 23 Core System

Asistente para la importación de texto: paso 4 (archivos de ancho fijo)

Este paso muestra la mejor opción, según el Asistente para la importación de texto, para leer el archivo

de datos y le permite modificar la manera en que el asistente leerá las variables del archivo de datos. Las

líneas verticales de la ventana de vista previa indican el lugar en el que en ese momento el Asistente para

la importación de texto piensa que cada variable comienza en el archivo.

Inserte, mueva y elimine líneas de ruptura de variable según convenga para separar variables. Si se

utilizan varias líneas para cada caso, los datos aparecerán como una línea para cada caso y las líneas

posteriores se adjuntarán al final de la línea.

Notas:

En archivos de datos generados por ordenador que producen un flujo continuo de valores de datos sin

espacios ni otras características distintivas, puede resultar difícil determinar el lugar en el que comienza

cada variable. Los archivos de datos del tipo citado anteriormente suelen depender de un archivo de

definición de datos u otro tipo de descripción escrita que especifique la ubicación por líneas y columnas

de cada variable.

Asistente para la importación de texto: paso 5

Este paso controla el nombre de la variable y el formato de datos que el Asistente para la importación de

texto utilizará para leer cada variable, así como las que se incluirán en el archivo de datos definitivo.

Nombre de variable. Puede sobrescribir los nombres de variable predeterminados y sustituirlos por otros

diferentes. Si lee nombres de variable desde el archivo de datos, el Asistente para la importación de texto

modificará de manera automática los nombres de variable que no cumplan las normas de denominación

de variables. Seleccione una variable en la ventana de vista previa e introduzca un nombre de variable.

Formato de datos. Seleccione una variable en la ventana de vista previa y, a continuación, seleccione un

formato de la lista desplegable. Pulse el botón del ratón con la tecla MAYÚS presionada para seleccionar

una serie de variables consecutivas, o bien con la tecla CTRL presionada para seleccionar una serie de

variables no consecutivas.

El formato predeterminado se determina en los valores de datos de las primeras 250 filas. Si se detecta

más de un formato (por ejemplo, numérico, de fecha, de cadena) en las primeras 250 filas, el formato

predefinido se define a cadena.

Opciones para el formato del Asistente para la importación de texto: Entre las opciones de formato

para la lectura de variables con el Asistente para la importación de texto se encuentran:

No importar. Omite la variable o variables seleccionadas del archivo de datos importado.

Numérico. Los valores válidos incluyen números, los signos más y menos iniciales y un indicador

decimal.

Cadena. Son valores válidos prácticamente todos los caracteres del teclado y los espacios en blanco

incrustados. En los archivos delimitados, puede especificar hasta un máximo de 32.767 de caracteres para

el valor. El Asistente para la importación de texto fija como valor predeterminado para el número de

caracteres el valor de cadena más largo que se haya encontrado para la variable o variables seleccionadas

en las primeras 250 filas del archivo. Para los archivos de ancho fijo, el número de caracteres en los

valores de cadena queda definido por la ubicación de las líneas de ruptura de variable en el paso 4.

Fecha/hora. Entre los valores válidos se encuentran las fechas con formato general: dd-mm-aaaa,

mm/dd/aaaa,dd.mm.aaaa,aaaa/mm/dd,hh:mm:ss, así como una amplia variedad de formatos de hora y fecha.

Los meses se pueden representar en dígitos, números romanos, abreviaturas de tres letras o con el

nombre completo. Seleccione un formato de fecha de la lista.

Capítulo 3. Archivos de datos 21

Dólar. Los valores válidos son números con un signo dólar inicial optativo y puntos separadores de

millares también optativos.

Coma. Entre los valores válidos se encuentran los números que utilizan un punto para separar los

decimales y una coma para separar los millares.

Punto. Entre los valores válidos se encuentran los números que utilizan una coma para separar los

decimales y un punto para separar los millares.

Nota: los valores que contengan caracteres no válidos para el formato seleccionado serán considerados

valores perdidos. Los valores que contengan uno cualquiera de los delimitadores especificados serán

considerados como valores múltiples.

Asistente para la importación de texto: paso 6

Este es el paso final del Asistente para la importación de texto. Puede guardar sus propias

especificaciones en un archivo para hacer uso de ellas cuando importe archivos de datos de texto

similares. También puede pegar la sintaxis generada por el Asistente para la importación de texto en una

ventana de sintaxis. Así podrá personalizar y/o guardar dicha sintaxis para utilizarla en futuras sesiones

o en trabajos de producción.

Caché local de los datos. Una caché de datos es una copia completa del archivo de datos almacenada en un

espacio de disco temporal. La caché del archivo de datos puede mejorar el rendimiento.

Lectura de datos de Cognos BI

Si tiene acceso a un servidor de IBM Cognos Business Intelligence, puede leer paquetes de datos e

informes de listas de IBM Cognos Business Intelligence en IBM SPSS Statistics.

Para leer datos de IBM Cognos Business Intelligence:

1. Elija en los menús:

Archivo >Leer datos de Cognos >Leer datos de Cognos BI

2. Especifique la URL de la conexión del servidor de IBM Cognos Business Intelligence.

3. Especifique la ubicación del paquete de datos o informe.

4. Seleccione los campos de datos o el informe que desee leer.

Si lo desea, puede:

vSeleccionar filtros de paquetes de datos.

vImportar datos agregados en lugar de datos en bruto.

vEspecificar valores de parámetro.

Modo. Especifica el tipo de información que desea leer: Datos oInforme. El único tipo de informe que se

puede leer es un informe de lista.

Conexión. La URL del servidor de Cognos Business Intelligence. Haga clic en el botón Editar para definir

los detalles de una nueva conexión de Cognos desde la que importar datos o informes. Consulte el tema

“Conexiones de Cognos” en la página 23 para obtener más información.

Posición. La ubicación del paquete o informe que desea leer. Haga clic en el botón Editar para ver una

lista de orígenes disponibles desde los que importar contenidos. Consulte el tema “Ubicación de Cognos”

en la página 23 para obtener más información.

Contenido. En datos, muestra los paquetes y filtros de datos disponibles. En informes, muestra los

informes disponibles.

22 Guía del usuario de IBM SPSS Statistics 23 Core System

Campos para importar. En los paquetes de datos, seleccione los campos que desee incluir y muévalos a

esta lista.

Informe para importar. En informes, seleccione el informe de lista que desea importar. El informe debe

ser un informe de lista.

Filtros para aplicar. En los paquetes de datos, seleccione los filtros que desee aplicar y muévalos a esta

lista.

Parámetros. Si este botón está activado, el objeto seleccionado tiene los parámetros definidos. Puede

utilizar los parámetros para realizar ajustes (por ejemplo, realizar un cálculo parametrizado) antes de

importar los datos. Si los parámetros están definidos pero no se proporcionan los predeterminados, el

botón muestra un triángulo de advertencia.

Agregar datos antes de realizar una importación. En paquetes de datos, si se define la agregación en el

paquete, puede importar los datos agregados en lugar de los datos en bruto.

Conexiones de Cognos

El cuadro de diálogo Conexiones de Cognos especifica la URL del servidor de IBM Cognos Business

Intelligence y cualquier credencial necesaria adicional.

URL de servidor de Cognos. La URL del servidor de IBM Cognos Business Intelligence. Es el valor de la

propiedad del entorno de "URI de distribuidor externo" de la configuración de IBM Cognos en el

servidor. Póngase en contacto con el administrador de su sistema para obtener más información.

Modo. Seleccione Establecer credenciales si necesita iniciar sesión con un espacio de nombre, nombre de

usuario y contraseña específica (por ejemplo, como administrador). Seleccione Usar conexión anónima

para iniciar sesión sin credenciales de usuario, en cuyo caso no necesitará cumplimentar el resto de

campos. Seleccione Credenciales almacenadas para utilizar la información de inicio de sesión de una

credencial almacenada. Para utilizar una credencial almacenada, debe estar conectado al IBM SPSS

Collaboration and Deployment Services Repository que contiene la credencial. Una vez que esté

conectado al repositorio, pulse Examinar para ver la lista de credenciales disponibles.

ID de espacio de nombres. El proveedor de seguridad para la autenticación que se utiliza para iniciar

sesión en el servidor. El proveedor de autenticación se utiliza para definir y mantener usuarios, grupos y

papeles y para controlar el proceso de autenticación.

Nombre de usuario. Introduzca el nombre de usuario con el que iniciará sesión en el servidor.

Contraseña. Introduzca la contraseña asociada con el nombre de usuario especificado.

Guardar como predeterminado. Guarda estas configuraciones como predeterminadas, para evitar tener

que volver a introducirlas cada vez.

Ubicación de Cognos

El cuadro de diálogo Especificar ubicación permite seleccionar un paquete desde el que importar los

datos o un paquete o carpeta desde la que importar informes. Muestra las carpetas públicas que tiene

disponibles. Si selecciona Datos en el cuadro de diálogo principal, la lista mostrará carpetas con paquetes

de datos. Si selecciona Informe en el cuadro de diálogo principal, la lista mostrará carpetas con informes

de lista. Seleccione la ubicación que desee desplazándose por la estructura de carpetas.

Especificación de parámetros de datos o informes

Si se han definido los parámetros de un objeto o informe de datos, puede especificar valores para estos

parámetros antes de importar los datos o informes. Un ejemplo de parámetros de un informe serían las

fechas de inicio y de fin del contenido del informe.

Capítulo 3. Archivos de datos 23

Nombre. El nombre del parámetro tal y como se especifica en la base de datos de IBM Cognos Business

Intelligence.

Tipo. Una descripción del parámetro.

Valor. El valor que se asignará al parámetro. Para introducir o editar un valor, haga doble clic en su

casilla en la tabla. Los valores no se validan aquí; todos los valores no válidos se detectan en el momento

de la ejecución.

Eliminar automáticamente los parámetros no válidos de la tabla. Esta opción está seleccionada de forma

predeterminada y eliminará cualquier parámetro no válido que se encuentre en el objeto o informe de

datos.

Cambio de nombres de variable

En paquetes de datos de IBM Cognos Business Intelligence, los nombres del campo de paquete se

convierten automáticamente a nombres válidos de variables. Puede usar la pestaña Campos del cuadro

de diálogo Leer datos de Cognos para sustituir los nombres predefinidos. Los nombres deben ser

exclusivos y cumplir las reglas de nombres de variable. Consulte el tema “Nombres de variable” en la

página 56 para obtener más información.

Lectura de datos de Cognos TM1

Si tiene acceso a una base de datos de IBM Cognos TM1, puede importar datos de TM1 de una vista

especificada a IBM SPSS Statistics. Los datos del cubo OLAP multidimensional de TM1 se presentan

cuando se leen en SPSS Statistics.

Importante: Para permitir el intercambio de datos entre SPSS Statistics y TM1, debe copiar los siguientes

tres prcoesos de SPSS Statistics al servidor TM1: ExportToSPSS.pro,ImportFromSPSS.pro,y

SPSSCreateNewMeasures.pro. Para añadir estos procesos al servidor TM1, debe copiarlos en el directorio

de datos del servidor TM1 y reiniciar el servidor TM1. Estos archivos están disponibles desde el

directorio common/scripts/TM1 en el directorio de instalación de SPSS Statistics.

Restricción:

vLa vista de TM1 desde la cual realiza la importación debe incluir uno o más elementos de una

dimensión de medida.

vLos datos que se van a importar desde TM1 deben tener el formato UTF-8.

Se importan todos los datos de la vista de TM1 especificada. Por lo tanto, lo mejor es limitar la vista en

los datos que son necesarios para el análisis. Cualquier filtrado necesario de los datos se realiza mejor en

TM1, por ejemplo, con el editor de subconjuntos de TM1.

Para leer datos de TM1:

1. Seleccione en los menús:

Archivo >Leer datos de Cognos >Leer datos de Cognos TM1

2. Conéctese al sistema de gestión del rendimiento de TM1.

3. Inicie sesión en el servidor TM1.

4. Seleccione un cubo TM1 y seleccione la vista que desea importar.

De forma opcional, puede alterar temporalmente los nombres predeterminados de las variables de SPSS

Statistics que se han creado a partir de los nombres de las dimensiones y mediciones de TM1.

Sistema PM

El URL del sistema de gestión del rendimiento que contiene el servidor TM1 al cual desea

conectarse. El sistema de gestión del rendimiento se define como un URL único para todos los

24 Guía del usuario de IBM SPSS Statistics 23 Core System

servidores TM1. Desde este URL, todos los servidores TM1 que se han instalado y que se están

ejecutando en el entorno se pueden descubrir y están accesibles. Especifique el URL y pulse

Conectar.

Servidor TM1

Cuando se establece la conexión con el sistema de gestión del rendimiento, seleccione el servidor

que contiene los datos que desea importar y pulse Iniciar sesión. Si no se ha conectado

previamente a este servidor, se le solicita que inicie la sesión.

Nombre de usuario y contraseña

Seleccione esta opción para iniciar sesión con un nombre de usuario y contraseña

especificados. Si el servidor utiliza el modo de autenticación 5 (seguridad de IBM

Cognos), seleccione el espacio de nombres que identifica el proveedor de autenticación de

seguridad en la lista disponible.

Credencial almacenada

Seleccione esta opción para utilizar la información de inicio de sesión de una credencial

almacenada. Para utilizar una credencial almacenada, debe estar conectado al IBM SPSS

Collaboration and Deployment Services Repository que contiene la credencial. Una vez

que esté conectado al repositorio, pulse Examinar para ver la lista de credenciales

disponibles.

Seleccione una vista de cubo de TM1 para importar.

Lista los nombres de los cubos dentro del servidor TM1 desde el cual puede importar datos.

Pulse dos veces un cubo para mostrar una lista de los vistas que puede importar. Seleccione una

vista y pulse la flecha hacia la derecha para moverla al campo Vista que va a importar.

Dimensiones de columna

Lista los nombres de las dimensiones de columna en la vista seleccionada.

Dimensiones de fila

Lista los nombres de las dimensiones de fila en la vista seleccionada.

Dimensiones de contexto

Lista los nombres de las dimensiones de contexto en la vista seleccionada.

Nota:

vCuando se importan datos, se crea una variable separada de SPSS Statistics para cada dimensión

regular y para cada elemento de la dimensión de medida.

vLas casillas vacías y las casillas con un valor de cero en TM1 se convierten al valor que falta en el

sistema.

vLas casillas con valores de cadena que no se pueden convertir a un valor numérico se convierten al

valor que falta del sistema.

Cambio de nombres de variable

De forma predeterminada, los nombres válidos de variable de IBM SPSS Statistics se generan

automáticamente a partir de los nombres de dimensión y los nombres de elementos en la dimensión de

medida desde la vista de cubo de IBM Cognos TM1 seleccionada. Puede utilizar la pestaña Campos del

diálogo Importar de TM1 para alterar temporalmente los nombres predeterminados. Los nombres deben

ser exclusivos y cumplir las reglas de nombres de variable. Consulte el tema para obtener más

información.

Lectura de datos de IBM SPSS Data Collection

En sistemas operativos de Microsoft Windows, puede leer los datos de productos IBM SPSS Data

Collection. Note: esta característica sólo está disponible si se ha instalado IBM SPSS Statistics en un

sistema operativo Microsoft Windows.

Capítulo 3. Archivos de datos 25

Para leer los orígenes de datos de IBM SPSS Data Collection, debe tener instalados los siguientes

elementos:

v.NET framework. Para obtener la versión más reciente de .NET framework, vaya a

http://www.microsoft.com/net.

vIBM SPSS Data Collection Survey Reporter Developer Kit. Está disponible una versión instalable de

IBM SPSS Data Collection Survey Reporter Developer Kit con el soporte de instalación.

Sólo puede añadir orígenes de datos de IBM SPSS Data Collection en el análisis en modo local. Esta

característica no está disponible en el análisis en modo distribuido con el servidor de IBM SPSS Statistics.

Para leer datos de un origen de datos de IBM SPSS Data Collection:

1. En cualquiera de las ventanas de IBM SPSS Statistics abiertas, elija en los menús:

Archivo >Abrir datos de IBM SPSS Data Collection

2. En la pestaña Propiedades de enlace de datos: Conexión, especifique el archivo de metadatos, el tipo

de datos de casos y el archivo de datos de casos.

3. Pulse en Aceptar.

4. En el cuadro de diálogo Importación de datos de IBM SPSS Data Collection, seleccione las variables

que desea incluir y seleccione cualquier criterio de selección de casos.

5. Pulse en Aceptar para leer los datos.

Pestaña Propiedades de enlace de datos: Conexión

Para leer un origen de datos de IBM SPSS Data Collection, debe especificar:

Ubicación de metadatos. El archivo del documento de metadatos (.mdd) que contiene la información de

definición del cuestionario.

Tipo de datos de casos. El formato del archivo de datos de casos. Los formatos disponibles incluyen:

vArchivo de datos de Quancept (DRS). Datos del caso en un archivo Quancept .drs,.drz o.dru.

vBase de datos de Quanvert. Datos del caso en una base de datos de Quanvert.

vBase de datos de IBM SPSS Data Collection (MS SQL Server). Datos de casos en una base de datos

relacional de investigación de mercado en SQL Server.

vArchivo de datos XML de IBM SPSS Data Collection. Datos de casos en un archivo XML.

Ubicación de datos de casos. El archivo que contiene los datos de casos. El formato de este archivo debe

ser coherente con el tipo de datos de casos seleccionado.

Nota: no se sabe hasta qué punto el resto de opciones de la pestaña Conexión o cualquier opción del resto

de pestañas Propiedades de enlace de datos pueden afectar a la lectura de datos de IBM SPSS Data

Collection en IBM SPSS Statistics, por lo que se recomienda no cambiar ninguna de ellas.

Pestaña Seleccionar variables

Puede seleccionar un subconjunto de variables que se van a leer. De forma predeterminada, todas las

variables estándar del origen de datos se muestran y aparecen seleccionadas.

vMostrar variables del sistema. Muestra cualquier variable "de sistema", incluidas las variables que

indican el estado de encuesta (en curso,finalizada,fecha de finalización, etc.). A continuación, puede

seleccionar cualquier variable de sistema que desee incluir. De forma predeterminada, se excluyen

todas las variables del sistema.

vMostrar variables de códigos. Muestra cualquier variable que represente códigos que se utilizan para

respuestas "Otros" abiertas para variables categóricas. A continuación, puede seleccionar cualquier

variable de códigos que desee incluir. De forma predeterminada, se excluyen todas las variables de

códigos.

26 Guía del usuario de IBM SPSS Statistics 23 Core System

vMostrar variables de archivo de origen. Muestra cualquier variable que contenga nombres de archivo

de imágenes de respuestas exploradas. A continuación, puede seleccionar cualquier variable de archivo

de origen que desee incluir. De forma predeterminada, todas las variables de archivo de origen están

excluidas.

Pestaña Selección de casos

Para los orígenes de datos de IBM SPSS Data Collection que contienen variables del sistema, puede

seleccionar casos basados en algunos criterios de variable de sistema. No es necesario incluir las variables

del sistema correspondientes en la lista de variables que se van a leer, pero las variables del sistema

necesarias deben existir en los datos de origen para aplicar los criterios de selección. Si las variables del

sistema necesarias no existen en los datos de origen, se ignorarán los criterios de selección

correspondientes.

Estado de recopilación de datos. Puede seleccionar datos de encuestados, datos de prueba o ambos.

También puede seleccionar casos basados en cualquier combinación de los siguientes parámetros de

estado de encuesta:

vFinalizada correctamente

vActiva/en curso

vTiempo agotado

vDetenida por un script

vDetenida por encuestado

vCierre del sistema de encuestas

vSeñal (terminado por una sentencia señalizadora en el script)

Fecha de finalización de la recopilación de datos. Puede seleccionar casos basados en la fecha de

finalización de la recopilación de datos.

vFecha de inicio. Se incluyen los casos para los que se completó la recopilación de datos durante o

después de la fecha especificada.

vFecha de finalización. Se incluyen los casos para los que se completó la recopilación de datos antes de

la fecha especificada. No se incluyen los casos para los que la recopilación de datos se completó en la

fecha de finalización.

vSi especifica tanto una fecha de inicio como una fecha de finalización, se definirá un rango de fechas

de finalización desde la fecha de inicio hasta la fecha de finalización (ésta última no incluida).

Información sobre el archivo

Un archivo de datos contiene mucho más que datos en bruto. También contiene información sobre la

definición de las variables, incluyendo:

vNombres de variable

vLos formatos de las variables

vLas etiquetas descriptivas de variable y de valor

Esta información se almacena en la parte del diccionario sobre el archivo de datos. El Editor de datos

proporciona una forma de presentar la información sobre la definición de la variable. También se puede

mostrar la información completa del diccionario para el conjunto de datos activo o para cualquier otro

archivo de datos.

Para mostrar información sobre los archivos de datos

1. Seleccione en los menús de la ventana Editor de datos:

Archivo >Mostrar información del archivo de datos

2. Para el archivo de datos abierto actualmente, elija Archivo de trabajo.

3. Para otros archivos de datos, elija Archivo externo y seleccione el archivo de datos.

Capítulo 3. Archivos de datos 27

La información sobre el archivo de datos se muestra en el Visor.

Almacenamiento de archivos de datos

Además de guardar los archivos de datos en formato de IBM SPSS Statistics, también puede guardarlos

en una amplia variedad de formatos externos, entre ellos:

vExcel y otros formatos de hoja de cálculo

vArchivos de texto delimitado por tabuladores y CSV

vSAS

vStata

vTablas de base de datos

Para guardar archivos de datos modificados

1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).

2. Elija en los menús:

Archivo >Guardar

El archivo de datos modificado se guarda y sobrescribe la versión anterior del archivo.

Guardar archivos de datos en la codificación de caracteres de la

página de códigos

Las versiones de IBM SPSS Statistics anteriores a la versión 16.0 no pueden leer los archivos de datos

Unicode. En el modo Unicode, para guardar un archivo de datos en la codificación de caracteres de la

página de códigos.

1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).

2. Desde los menús, elija:

Archivo >Guardar como

3. En la lista desplegable Guardar como tipo en el diálogo Guardar datos, seleccione Codificación local

de SPSS Statistics.

4. Especifique un nombre para el archivo de datos nuevo.

El archivo de datos modificado se guarda en la codificación de caracteres de la página de códigos del

entorno local actual. Esta acción no tiene ningún efecto sobre el conjunto de datos activo. La codificación

del conjunto de datos activo no se modifica. Guardar un archivo en la codificación de caracteres de la

página de códigos es similar a guardar un archivo en un formato externo como, por ejemplo, texto

delimitado por tabuladores o Excel.

Almacenamiento de archivos de datos en formatos externos

1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).

2. Elija en los menús:

Archivo >Guardar como...

3. Seleccione un tipo de archivo de la lista desplegable.

4. Introduzca un nombre de archivo para el nuevo archivo de datos.

Para escribir nombres de variable en la primera fila de una hoja de cálculo o de un archivo de datos

delimitados por tabuladores:

1. Pulse en Escribir nombres de variable en hoja de cálculo en el cuadro de diálogo Guardar datos

como.

Para guardar las etiquetas de valor en lugar de los valores de los datos en archivos Excel:

28 Guía del usuario de IBM SPSS Statistics 23 Core System

1. Pulse en Guardar etiquetas de valor donde se hayan definido en vez de valores de datos en el

cuadro de diálogo Guardar datos como.

Para guardar etiquetas de valor en un archivo de sintaxis de SAS (esta opción sólo está activa si se ha

seleccionado un tipo de archivo de SAS):

1. Pulse en Guardar etiquetas de valor en un archivo .sas en el cuadro de diálogo Guardar datos como.

Para obtener información sobre la exportación de datos en tablas de base de datos, consulte “Exportación

a base de datos” en la página 35.

Almacenamiento de datos: tipos de archivos de datos

Puede guardar datos en los siguientes formatos:

SPSS Statistics (*.sav). Formato de IBM SPSS Statistics.

vLos archivos de datos guardados con formato IBM SPSS Statistics no se pueden leer en versiones

anteriores a la 7.5. Los archivos de datos guardados en codificación Unicode no se pueden leer en

versiones de IBM SPSS Statistics anteriores a la 16.0.

vAl utilizar archivos de datos con nombres de variable con longitud superior a ocho bytes en 10.x u

11.x, se utilizan versiones exclusivas de ocho bytes de los nombres de variable, pero se mantienen los

nombres originales de las variables para su utilización en la versión 12.0 o posterior. En versiones

anteriores a la 10.0, los nombres largos originales de las variables se pierden si se guarda el archivo de

datos.

vAl utilizar archivos de datos con variables de cadena con más de 255 bytes en versiones anteriores a la

versión 13.0, dichas variables de cadena se fragmentan en variables de cadena de 255 bytes.

SPSS Statistics comprimido (*.zsav). Formato de IBM SPSS Statistics comprimido.

vLos archivos ZSAV tienen las mismas características que los archivos SAV, pero ocupan menos espacio

en disco.

vLos archivos ZSAV pueden tardar más o menos tiempo en abrirse y cerrarse, dependiendo del tamaño

de archivo y de la configuración del sistema. Se necesita más tiempo para descomprimir y comprimir

archivos ZSAV. Sin embargo, como los archivos ZSAV ocupan menos espacio en disco, reducen el

tiempo necesario para leer y escribir en disco. A medida que el tamaño del archivo aumenta, este

ahorro de tiempo sobrepasa el tiempo adicional necesario para descomprimir y comprimir los archivos.

vSolo IBM SPSS Statistics versión 21 o posterior puede abrir archivos ZSAV.

vLa opción para guardar el archivo de datos con su codificación de página de código local no está

disponible en archivos ZSAV. Estos archivos siempre se guardan en codificación UTF-8.

Codificación local de SPSS Statistics (*.sav). En el modo Unicode, esta opción guarda el archivo de

datos en la codificación de caracteres de la página de códigos del entorno local. Esta opción no está

disponible en el modo de página de códigos.

SPSS 7.0 (*.sav). Formato de la versión 7.0. Los archivos de datos guardados con formato de la versión

7.0 se pueden leer en la versión 7.0 y en versiones anteriores, pero no incluyen los conjuntos de

respuestas múltiples definidos ni la información sobre la introducción de datos para Windows.

SPSS/PC+ (*.sys). Formato SPSS/PC+. Si el archivo de datos contiene más de 500 variables, sólo se

guardarán las 500 primeras. Para las variables con más de un valor perdido del usuario, los valores

perdidos del usuario adicionales se recodificarán en el primero de estos valores. Este formato sólo está

disponible en los sistemas operativos Windows.

Portátil (*.por). El formato portátil puede leerse en otras versiones de IBM SPSS Statistics y en versiones

para otros sistemas operativos. Los nombres de variable se limitan a ocho bytes, y se convertirán a

nombres exclusivos de ocho bytes si es preciso. En la mayoría de los casos, ya no es necesario guardar los

datos en formato portátil, ya que los archivos de datos en formato IBM SPSS Statistics deberían ser

Capítulo 3. Archivos de datos 29

independientes de la plataforma y del sistema operativo. No se puede guardar los archivos de datos en

un archivo portátil en modo Unicode. Consulte el tema “Opciones generales” en la página 217 para

obtener más información.

Delimitado con tabuladores (*.dat). Archivos de texto con valores separados por tabuladores. (Nota: Los

tabuladores incrustados en los valores de cadena se conservarán como tabuladores en el archivo

delimitado por tabuladores. No se realiza ninguna distinción entre los tabuladores incrustados en los

valores y los tabuladores que separan los valores). Puede guardar archivos en Unicode o en codificación

de página de código local.

Delimitado por comas (*.csv). Archivos de texto con valores separados por comas o puntos y coma. Si el

indicador decimal actual de IBM SPSS Statistics es un punto, los valores se separan mediante comas. Si el

indicador decimal actual es una coma, los valores se separan mediante punto y coma. Puede guardar

archivos en Unicode o en codificación de página de código local.

ASCII fijo (*.dat). Archivos de texto con formato fijo, utilizando los formatos de escritura

predeterminados para todas las variables. No existen tabuladores ni espacios entre los campos de

variable. Puede guardar archivos en Unicode o en codificación de página de código local.

Excel 2007 (*.xlsx). Libro de trabajo con formato XLSX de Microsoft Excel 2007. El número máximo de

variables es 16.000, el resto de variables adicionales por encima de esa cifra se eliminan. Si el conjunto de

datos contiene más de un millón de casos, se crean varias hojas en el libro de trabajo.

Excel de 97 a 2003 (*.xls). Libro de trabajo de Microsoft Excel 97. El número máximo de variables es 256,

el resto de variables adicionales por encima de esa cifra se eliminan. Si el conjunto de datos contiene más

de 65.356 casos, se crean varias hojas en el libro de trabajo.

Excel 2.1 (*.xls). Archivo de hoja de cálculo de Microsoft Excel 2,1. El número máximo de variables es de

256 y el número máximo de filas es de 16,384.

1-2-3 Release 3.0 (*.wk3). Archivo de hoja de cálculo de Lotus 1-2-3, versión 3.0. El número máximo de

variables que puede guardar es 256.

1-2-3 Release 2.0 (*.wk1). Archivo de hoja de cálculo de Lotus 1-2-3, versión 2.0. El número máximo de

variables que puede guardar es 256.

1-2-3 Release 1.0 (*.wks). Archivo de hoja de cálculo de Lotus 1-2-3, versión 1A. El número máximo de

variables que puede guardar es 256.

SYLK (*.slk). Formato de enlace simbólico para archivos de hojas de cálculo de Microsoft Excel y de

Multiplan. El número máximo de variables que puede guardar es 256.

dBASE IV (*.dbf). Formato dBASE IV.

dBASE III (*.dbf). Formato dBASE III.

dBASE II (*.dbf). Formato dBASE II.

SAS v9+ Windows (*.sas7bdat). Versiones 9 de SAS para Windows. Puede guardar archivos en Unicode

(UTF-8) o en codificación de página de código local.

SAS v9+ UNIX (*.sas7bdat). Versiones 9 de SAS para UNIX. Puede guardar archivos en Unicode (UTF-8)

o en codificación de página de código local.

Extensión corta de Windows v7-8 de SAS (*.sd7). Versiones 7-8 de SAS para Windows con formato de

nombre de archivo corto.

30 Guía del usuario de IBM SPSS Statistics 23 Core System

Extensión larga de Windows v7-8 de SAS (*.sas7bdat). Versiones 7-8 de SAS para Windows con formato

de nombre de archivo largo.

SAS v7-8 para UNIX (*.sas7bdat). SAS v8 para UNIX.

SAS v6 para Windows (*.sd2). Formato de archivo de SAS v6 para Windows/OS2.

SAS v6 para UNIX (*.ssd01). Formato de archivo de SAS v6 para UNIX (Sun, HP, IBM).

SAS v6 para Alpha/OSF (*.ssd04). Formato de archivo de SAS v6 para Alpha/OSF (DEC UNIX).

Transporte de SAS (*.xpt). Archivo de transporte de SAS.

Stata Versión 13 Intercooled (*.dta).

Stata Versión 13 SE (*.dta).

Stata Versión 12 Intercooled (*.dta).

Stata Versión 12 SE (*.dta).

Stata Versión 11 Intercooled (*.dta).

Stata Versión 11 SE (*.dta).

Stata Versión 10 Intercooled (*.dta).

Stata Versión 10 SE (*.dta).

Stata Versión 9 Intercooled (*.dta).

Stata Versión 9 SE (*.dta).

Stata Versión 8 Intercooled (*.dta).

Stata Versión 8 SE (*.dta).

Stata Versión 7 Intercooled (*.dta).

Stata Versión 7 SE (*.dta).

Stata Versión 6 (*.dta).

Stata Versiones 4–5 (*.dta).

Nota: los nombres de los archivos de datos SAS pueden tener hasta 32 caracteres de longitud. No se

permiten espacios en blanco ni caracteres no alfanuméricos distintos del subrayado ("_"), y los nombres

deben empezar por una letra o un subrayado, tras los cuales pueden aparecer números.

Opciones de almacenamiento de archivos

En los archivos de hoja de cálculo, los delimitados por tabuladores y los delimitados por coma, se

pueden escribir nombres de variable en la primera fila del archivo.

Almacenamiento de archivos de datos en formato de Excel

Puede guardar los datos en uno de los tres formatos de archivo de Microsoft Excel. Excel 2.1, Excel 97 y

Excel 2007.

Capítulo 3. Archivos de datos 31

vExcel 2.1 y Excel 97 tienen un límite de 256 columnas; por lo tanto, sólo se incluyen las primeras 256

variables.

vExcel 2007 tiene un límite de 16.000 columnas; por lo tanto, sólo se incluyen las primeras 16.000

variables.

vExcel 2,1 tiene un límite de 16.384 filas; por lo tanto, sólo se incluyen los primeros 16.384 casos.

vExcel 97 y Excel 2007 tienen un número limitado de filas por hoja, pero como los libros de trabajo

pueden tener múltiples hojas, se crean más cuando se excede el máximo de cada hoja.

Tipos de variables

La siguiente tabla muestra la relación del tipo de las variables entre los datos originales de IBM SPSS

Statistics y los datos exportados a Excel.

Tabla 2. Cómo se correlacionan los datos de Excel con los formatos y tipos de variable de IBM SPSS Statistics

IBM SPSS Statistics Tipo de variable Formato de datos de Excel

Numérico 0.00; #,##0.00; ...

Coma 0.00; #,##0.00; ...

Dólar $#,##0_); ...

Fecha d-mmm-aaaa

Hora hh:mm:ss

Cadena General

Almacenamiento de archivos de datos en formato SAS

Al guardar un archivo de SAS, se aplica un tratamiento especial a determinadas características de los

datos. Entre estos casos se incluyen:

vAlgunos caracteres que se permiten en los nombres de variables de IBM SPSS Statistics no son válidos

en SAS, como por ejemplo @,#y$.Alexportar los datos, estos caracteres no válidos se reemplazan

por un carácter de subrayado.

vLos nombres de variable de IBM SPSS Statistics que contienen caracteres de varios bytes (por ejemplo,

caracteres japoneses o chinos) se convierten en nombres de variable con formato general Vnnn,

dondennn es un valor entero.

vLas etiquetas de variable de IBM SPSS Statistics que contienen más de 40 caracteres se truncan al

exportarlas a un archivo de SAS v6.

vSi existen, las etiquetas de variable de IBM SPSS Statistics se correlacionan con etiquetas de variable de

SAS. Si no hay ninguna etiqueta de variable en los datos de IBM SPSS Statistics, el nombre de variable

se correlaciona con la etiqueta de variable de SAS.

vSAS sólo permite que exista un valor perdido del sistema, mientras que IBM SPSS Statistics permite

que haya varios valores perdidos del usuario y del sistema. Por tanto, todos los valores perdidos del

usuario en IBM SPSS Statistics se correlacionan con un único valor perdido del sistema en el archivo

SAS.

vLos archivos de datos SAS 6-8 se guardará en la codificación basada en el entorno local actual de IBM

SPSS Statistics, con independencia del modo actual (Unicode o página de código). En modo Unicode,

los archivos SAS 9 se guardan en formato UTF-8. En modo de página de código, los archivos SAS 9 se

guardan en la codificación del entorno local actual.

vSe pueden guardar un máximo de 32.767 variables en SAS 6-8.

vLos nombres de los archivos de datos SAS pueden tener hasta 32 caracteres de longitud. No se

permiten espacios en blanco ni caracteres no alfanuméricos distintos del subrayado ("_"), y los nombres

deben empezar por una letra o un subrayado, tras los cuales pueden aparecer números.

Almacenamiento de etiquetas de valor

32 Guía del usuario de IBM SPSS Statistics 23 Core System

Existe la posibilidad de guardar los valores y las etiquetas de valor asociadas al archivo de datos en un

archivo de sintaxis de SAS. Este archivo de sintaxis contiene comandos proc format yproc datasets que

se puede ejecutar en SAS para crear un archivo de catálogo de formato SAS.

Esta característica no se admite para el archivo de transporte de SAS.

Tipos de variables

La siguiente tabla muestra la relación del tipo de las variables entre los datos originales de IBM SPSS

Statistics y los datos exportados a SAS.

Tabla 3. Cómo se correlacionan los formatos y tipos de variables SAS con los formatos y tipos de IBM SPSS

Statistics

IBM SPSS Statistics Tipo de variable Tipo de variable de SAS Formato de datos de SAS

Numérico Numérico 12

Coma Numérico 12

Puntos Numérico 12

Notación científica Numérico 12

Fecha Numérico (Fecha) p.ej., MMDDAA10,...

Fecha (Hora) Numérico Hora18

Dólar Numérico 12

Moneda personalizada Numérico 12

Cadena Carácter $8

Almacenamiento de archivos de datos en formato Stata

vLos datos se pueden escribir en formato Stata 5–13 y en formatoIntercooled y SE (versión 7 o

posterior).

vLos archivos de datos que se guardan en formato Stata 5 se pueden leer con Stata 4.

vLos primeros 80 bytes de etiquetas de variable se guardan como etiquetas de variable Stata.

vPara Stata releases 4-8, los primeros 80 bytes de etiquetas de valor para variables numéricas se guardan

como etiquetas de valor Stata. Para Stata release 9 o posterior, se guardan las etiquetas de valor

completas para variables numéricas. Las etiquetas de valor se excluyen para variables de cadena,

valores numéricos no enteros y valores numéricos mayores que un valor absoluto de 2.147.483.647.

vPara las versiones 7 y posteriores, los primeros 32 bytes de nombres de variable en un formato que

distingue entre mayúsculas y minúsculas se guardan como nombres de variable Stata. Para versiones

anteriores, los primeros ocho bytes de nombres de variable se guardan como nombres de variable

Stata. Cualquier carácter distinto de letras, número y caracteres de subrayado se convierten en

caracteres de subrayado.

vLos nombres de variable de IBM SPSS Statistics que contienen caracteres de varios bytes (por ejemplo,

caracteres japoneses o chinos) se convierten en nombres de variables con formato general Vnnn,

dondennn es un valor entero.

vPara las versiones 5–6 y las versiones de Intercooled 7 y posteriores, los 80 primeros bytes de los

valores de cadena se guardan. Para Stata SE 7–12, los primeros 244 bytes de valores de cadena se

guardan. Para Stata SE 13 o posteriores, se guardan los valores de cadena completos,

independientemente de la longitud.

vPara las versiones 5–6 y las versiones de Intercooled 7 y posteriores, solo se guardan las primeras 2.047

variables. Para Stata SE 7 o posteriores, solo se guardan las primeras 32.767 variables.

Capítulo 3. Archivos de datos 33

Tabla 4. Cómo se correlaciona el formato y tipo de variable de Stata con el formato y tipo de IBM SPSS Statistics

IBM SPSS Statistics Tipo de

variable

Tipo de variable Stata Formato de datos Stata

Numérico Numérico g

Coma Numérico g

Puntos Numérico g

Notación científica Numérico g

Date*, Momento_fecha Numérico D_m_Y

Tiempo, Tiempo_fecha Numérico g (número de segundos)

Dia_semana Numérico g (1–7)

Mes Numérico g (1–12)

Dólar Numérico g

Moneda personalizada Numérico g

Cadena Cadena s

*Date, Adate, Edate, SDate, Jdate, Qyr, Moyr, Wkyr

Almacenamiento de subconjuntos de variables

El cuadro de diálogo Guardar datos como: Variables permite seleccionar las variables que desea guardar

en el nuevo archivo de datos. De forma predeterminada, se almacenarán todas las variables. Anule la

selección de las variables que no desea guardar o pulse en Eliminar todo y, a continuación, seleccione

aquellas variables que desea guardar.

Sólo visibles. Selecciona sólo variables de conjuntos de variables que se usan actualmente. Consulte el

tema “Uso de conjuntos de variables para mostrar y ocultar variables” en la página 206 para obtener más

información.

Para guardar un subconjunto de variables

1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).

2. Elija en los menús:

Archivo >Guardar como...

3. Pulse en Variables.

4. Seleccione las variables que desee almacenar.

Cifrado de archivos de datos

Puede proteger información confidencial guardada en un archivo de datos cifrando el archivo con una

contraseña. Una vez cifrado, el archivo solo se puede abrir con la contraseña.

1. Active la ventana Editor de datos (pulse en cualquier punto de la ventana para activarla).

2. Elija en los menús:

Archivo >Guardar como...

3. Seleccione Cifrar archivo con contraseña en el cuadro de diálogo Guardar datos como.

4. Pulse en Guardar.

5. En el cuadro de diálogo Cifrar archivo, introduzca una contraseña y vuelva a introducirla en el

cuadro de texto Confirmar contraseña. Las contraseñas están limitadas a 10 caracteres y distinguen

entre mayúsculas y minúsculas.

34 Guía del usuario de IBM SPSS Statistics 23 Core System

Advertencia: si pierde las contraseñas, no podrá recuperarlas. Si se pierde la contraseña, no podrá abrir el

archivo.

Creación de contraseñas seguras

vUtilice ocho o más caracteres.

vIncluya números, símbolos e incluso signos de puntuación en su contraseña.

vEvite secuencias de números o caracteres como, por ejemplo, "123" y"abc", así como repeticiones; por

ejemplo, "111aaa".

vNo cree contraseñas que contengan información personal como, por ejemplo, fechas de cumpleaños o

apodos.

vCambie periódicamente la contraseña.

Nota: no se permite guardar los archivos cifrados en un IBM SPSS Collaboration and Deployment

Services Repository.

Modificación de archivos cifrados

vSi abre un archivo cifrado, realice las modificaciones y seleccione Archivo > Guardar; el archivo

modificado se guardará con la misma contraseña.

vPuede cambiar la contraseña en un archivo cifrado abriendo el archivo, repita el procedimiento para

cifrarlo y especifique una contraseña diferente en el cuadro de diálogo Cifrar archivo.

vPuede guardar una versión no cifrada de un archivo cifrado abriendo el archivo, seleccionando Archivo

> Guardar como y cancelando la selección de Cifrar archivo con contraseña en el cuadro de diálogo

Guardar datos como.

Nota: Los archivos de datos y los documentos de resultado cifrados no se pueden abrir en versiones de

IBM SPSS Statistics anteriores a la versión 21. Los archivos de sintaxis cifrados no se pueden abrir en

versiones anteriores a la versión 22.

Exportación a base de datos

El Asistente para la exportación a base de datos permite:

vReemplazar los valores de los campos (columnas) de la tabla de la base de datos existente o añadir

nuevos campos a una tabla.

vAñadir nuevos registros (filas) a una tabla de base de datos.

vReemplazar completamente una tabla de base de datos o crear una tabla nueva.

Para exportar datos a una base de datos:

1. En los menús de la ventana del Editor de datos correspondientes al conjunto de datos que contiene

los datos que se desean exportar, seleccione:

Archivo >Exportar a base de datos

2. Seleccione el origen de base de datos.

3. Siga las instrucciones del asistente para exportación para exportar los datos.

Creación de campos de base de datos a partir de variables de IBM SPSS Statistics

Al crear nuevos campos (añadiendo campos a una tabla de base de datos existente, creando una tabla

nueva o reemplazando una tabla), puede especificar los nombres de campo, el tipo de datos y el ancho

(donde corresponda).

Nombre de campo. Los nombres de campo predeterminados son los mismos que los nombres de variable

de IBM SPSS Statistics. Puede cambiar los nombres de campo a cualquier nombre permitido por el

formato de la base de datos. Por ejemplo, muchas bases de datos admiten que los nombres de los campos

Capítulo 3. Archivos de datos 35

contengan caracteres que no se permiten en los nombres de variable, incluidos los espacios. Por tanto, un

nombre de variable como LlamadaEspera puede cambiarse a un nombre de campo Llamada en espera.

Tipo. El asistente para la exportación realiza las asignaciones iniciales de los tipos de datos según los

tipos de datos ODBC estándar o los tipos de datos admitidos por el formato de la base de datos

seleccionada que más se parezca al formato de datos IBM SPSS Statistics definido. No obstante, las bases

de datos puede realizar distinciones de tipos que no tenga equivalente directo en IBM SPSS Statistics y

viceversa. Por ejemplo, la mayoría de los valores numéricos de IBM SPSS Statistics se almacenan como

valores en punto flotante con doble precisión, mientras que los tipos de datos numéricos de las bases de

datos incluyen números flotantes (doble), enteros, reales, etc. Además, muchas bases de datos no tienen

equivalentes a los formatos de tiempo de IBM SPSS Statistics. Puede cambiar el tipo de datos a cualquiera

de los disponibles en la lista desplegable.

Como norma general, el tipo de datos básico (de cadena o numéricos) de la variable debe coincidir con el

tipo de datos básico del campo de la base de datos. Si existe alguna discrepancia de tipo de datos que la

base de datos no pueda resolver, se producirá un error y los datos no se exportarán a la base de datos.

Por ejemplo, si exporta una variable de cadena a un campo de la base de datos con un tipo de datos

numérico, se producirá un error si algún valor de la variable de cadena contiene caracteres no numéricos.

Amplitud. Puede cambiar el ancho definido de los tipos de campo de cadena (char, varchar). Los anchos

de campo numérico se definen por el tipo de datos.

De forma predeterminada, los formatos de las variables de IBM SPSS Statistics se correlacionan con tipos

de campo de la base de datos en función del siguiente esquema general. Los tipos de campo de la base

de datos reales pueden variar dependiendo de la base de datos.

Tabla 5. Conversión de formato para bases de datos

Formatos de las variables IBM SPSS Statistics Tipo de campo de la base de datos

Numérico Flotante o doble

Coma Flotante o doble

Puntos Flotante o doble

Notación científica Flotante o doble

Fecha Fecha o Momento_fecha o marca de hora

Momento_fecha Momento_fecha o marca de hora

Tiempo, Tiempo_fecha Flotante o doble (número de segundos)

Dia_semana Entero (1–7)

Mes Entero (1–12)

Dólar Flotante o doble

Moneda personalizada Flotante o doble

Cadena Char or Varchar

Valores perdidos del usuario

Existen dos opciones para el tratamiento de los valores perdidos del usuario cuando los datos de las

variables se exportan a campos de bases de datos:

vExportar como valores válidos. Los valores perdidos del usuario se tratan como valores no perdidos,

válidos, regulares.

vExportar los valores perdidos del usuario numéricos como nulos y exportar los valores perdidos del

usuario de cadena como espacios en blanco. Los valores perdidos del usuario numéricos reciben el

mismo tratamiento que los valores perdidos del sistema. Los valores perdidos del usuario se convierten

en espacios en blanco (las cadenas no pueden ser valores perdidos del sistema).

36 Guía del usuario de IBM SPSS Statistics 23 Core System

Selección de un origen de datos

En el primer panel del Asistente para la exportación a base de datos, seleccione el origen de datos al que

desea exportar los datos.

Puede exportar datos a cualquier origen de base de datos para el que tenga el controlador ODBC

adecuado. (Nota: no se admite la exportación a orígenes de datos OLE DB).

Si no tiene configurado ningún origen de datos ODBC o si desea añadir uno nuevo, pulse en Añadir

origen de datos ODBC.

vEn los sistemas operativos Linux, este botón no está disponible. Los orígenes de datos ODBC se

especifican en odbc.ini y es necesario especificar las variables de entorno ODBCINI con la ubicación de

dicho archivo. Si desea obtener más información, consulte la documentación de los controladores de la

base de datos.

vEn el análisis en modo distribuido (disponible con IBM SPSS Statistics Server), este botón no está

disponible. Para añadir orígenes de datos en el análisis en modo distribuido, consulte con el

administrador del sistema.

Un origen de datos ODBC está compuesto por dos partes esenciales de información: el controlador que se

utilizará para acceder a los datos y la ubicación de la base de datos a la que se desea acceder. Para

especificar los orígenes de datos, deberán estar instalados los controladores adecuados. El soporte de

instalación incluye controladores de una gran variedad de formatos de base de datos .

Algunos orígenes de datos pueden requerir un ID de acceso y una contraseña antes de poder continuar

con el siguiente paso.

Selección del modo de exportar los datos

Una vez seleccionado el origen de datos, se indica la forma en la que se desean exportar los datos.

Las siguientes opciones están disponibles para exportar datos a una base de datos:

vReemplazar los valores de los campos existentes. Reemplaza los valores de los campos seleccionados

en una tabla existente con valores de las variables seleccionadas en el conjunto de datos activo.

Consulte el tema “Sustitución de los valores de los campos existentes” en la página 39 para obtener

más información.

vAñadir nuevos campos a una tabla existente. Crea nuevos campos en una tabla existente que contiene

los valores de las variables seleccionadas en el conjunto de datos activo. Consulte el tema “Adición de

nuevos campos” en la página 39 para obtener más información. Esta opción no está disponible para los

archivos de Excel.

vAñadir nuevos registros a una tabla existente. Añade nuevos registros (filas) a una tabla existente que

contiene los valores de los casos del conjunto de datos activo. Consulte el tema “Adición de nuevos

registros (casos)” en la página 39 para obtener más información.

vEliminar una tabla existente y crear una tabla nueva con el mismo nombre. Elimina la tabla

especificada y crea una nueva tabla con el mismo nombre que contiene variables seleccionadas del

conjunto de datos activo. Toda la información de la tabla original, incluidas las definiciones de las

propiedades del campo (como las claves primarias o los tipos de datos) se pierde. Consulte el tema

“Creación de una nueva tabla o sustitución de una tabla” en la página 40 para obtener más

información.

vCrear una tabla nueva. Crea una tabla nueva en la base de datos que contiene datos de las variables

seleccionadas en el conjunto de datos activo. El nombre puede ser cualquier valor que esté permitido

como nombre de tabla por el origen de datos. El nombre no puede coincidir con el nombre de una

tabla o vista existentes en la base de datos. Consulte el tema “Creación de una nueva tabla o

sustitución de una tabla” en la página 40 para obtener más información.

Capítulo 3. Archivos de datos 37

Selección de una tabla

Al modificar o reemplazar una tabla de la base de datos, es necesario seleccionar la tabla que desea

modificar o reemplazar. Este panel del Asistente para la exportación a bases de datos muestra una lista

de tablas y vistas de la base de datos seleccionada.

De forma predeterminada, la lista muestra sólo las tablas de bases de datos estándar. Puede controlar el

tipo de elementos que se muestran en la lista:

vTablas. Tablas de base de datos estándar.

vVistas. Las vistas son "tablas" virtuales o dinámicas definidas por consultas. Estas tablas pueden incluir

uniones de varias tablas y/o campos derivados de cálculos basados en los valores de otros campos.

Puede añadir registros o reemplazar valores de campos existentes en vistas, pero es posible que los

campos que se pueden modificar estén limitados dependiendo de cómo esté estructurada la vista. Por

ejemplo, no se puede modificar un campo derivado, añadir campos a una vista ni reemplazar una

vista.

vSinónimos. Un sinónimo es un alias para una tabla o vista que suele estar definido en una consulta.

vTablas del sistema. Las tablas del sistema definen propiedades de la base de datos. En algunos casos,

las tablas de base de datos estándar pueden estar clasificadas como tablas del sistema y sólo se

mostrarán si se selecciona esta opción. El acceso a tablas del sistema reales suele estar limitado a los

administradores de la base de datos.

Selección de casos para exportar

La selección de casos en el Asistente para la exportación a base de datos está limitada, bien a todos los

casos o a los casos seleccionados a través de una condición de filtrado definida previamente. Si no hay

ningún filtrado de casos activo, este panel no aparecerá y se exportarán todos los casos del conjunto de

datos activo.

Para obtener información sobre la definición de una condición de filtrado para la selección de casos,

consulte “Seleccionar casos” en la página 121.

Emparejamiento de casos con registros

Al añadir campos (columnas) a una tabla existente o reemplazar los valores de los campos existentes, es

necesario asegurarse de que cada caso (fila) del conjunto de datos activo coincide correctamente con el

correspondiente registro de la base de datos.

vEn la base de datos, el campo o conjunto de campos que identifica de forma exclusiva cada registro

suele estar designado como la clave primaria.

vDebe identificar las variables correspondientes a los campos de clave primaria u otros campos que

identifican de forma exclusiva cada registro.

vLos campos no tienen que ser la clave primaria de la base de datos, sin embargo, el valor de campo o

la combinación de los valores de campo deben ser exclusivos para cada caso.

Para casar las variables con los campos de la base de datos que identifican cada registro de forma

exclusiva:

1. arrastre y coloque las variables en los campos correspondientes de la base de datos.

2. Seleccione una variable de la lista de variables, seleccione el campo correspondiente en la tabla de la

base de datos y pulse en Conectar.

Para eliminar una línea de conexión:

3. Seleccione la línea de conexión y pulse la tecla Supr.

Nota: los nombres de variable y los nombres de los campos de la base de datos es posible que no sean

idénticos (ya que los nombres de la base de datos pueden contener caracteres que no admiten los

nombres de variable de IBM SPSS Statistics), pero si el conjunto de datos activo se creó a partir de la

38 Guía del usuario de IBM SPSS Statistics 23 Core System

tabla de base de datos que está modificando, los nombres de variable o las etiquetas de variable

normalmente serán como mínimo similares a los nombres de campo de la base de datos.

Sustitución de los valores de los campos existentes

Para reemplazar los valores de los campos existentes en una base de datos:

1. En el panel Seleccionar cómo exportar los datos del Asistente para la exportación a base de datos,

seleccione Reemplazar los valores de los campos existentes.

2. En el panel Seleccione una tabla o vista, seleccione la tabla de base de datos.

3. En el panel Casar casos con registros, case las variables que identifican de forma exclusiva cada caso

con los nombres de los campos de la base de datos correspondientes.

4. Para cada campo del que desee reemplazar los valores, arrastre la variable que contiene los nuevos

valores y colóquela en la columna Origen de valores, junto al nombre del campo de la base de datos

correspondiente.

vComo norma general, el tipo de datos básico (de cadena o numéricos) de la variable debe coincidir con

el tipo de datos básico del campo de la base de datos. Si existe alguna discordancia de tipos de datos

que la base de datos no pueda resolver, se producirá un error y no se exportará ningún dato a la base

de datos. Por ejemplo, si exporta una variable de cadena a un campo de la base de datos con un tipo

de datos numérico (por ejemplo, doble, real, entero), se producirá un error si algún valor de la variable

de cadena contiene caracteres no numéricos. La letra adel icono situado junto a una variable denota

una variable de cadena.

vNo se puede modificar el nombre, el tipo ni la anchura del campo. Los atributos del campo de la base

de datos originales se conservan, sólo se reemplazan los valores.

Adición de nuevos campos

Para añadir nuevos campos a una tabla de base de datos existente:

1. En el panel Seleccionar cómo exportar los datos del Asistente para la exportación a base de datos,

seleccione Añadir nuevos campos a una tabla existente.

2. En el panel Seleccione una tabla o vista, seleccione la tabla de base de datos.

3. En el panel Casar casos con registros, case las variables que identifican de forma exclusiva cada caso

con los nombres de los campos de la base de datos correspondientes.

4. Arrastre las variables que desea añadir como campos nuevos y colóquelas en la columna Origen de

valores.

Para obtener información sobre nombres de campo y tipos de datos, consulte la sección de creación de

campos de base de datos a partir de variables de IBM SPSS Statistics en “Exportación a base de datos” en

la página 35.

Mostrar los campos existentes. Seleccione esta opción para mostrar una lista de campos existentes. No

puede utilizar este panel en el Asistente para la exportación a base de datos para reemplazar campos

existentes, pero puede resultar útil saber los campos que ya están presentes en la tabla. Si desea sustituir

los valores de los campos existentes, consulte “Sustitución de los valores de los campos existentes”.

Adición de nuevos registros (casos)

Para añadir nuevos registros (caso) a una tabla de base de datos:

1. En el panel Seleccionar cómo exportar los datos del Asistente para la exportación a base de datos,

seleccione Añadir nuevos registros a una tabla existente.

2. En el panel Seleccione una tabla o vista, seleccione la tabla de base de datos.

3. Haga coincidir las variables del conjunto de datos activo con los campos de la tabla arrastrando las

variables y colocándolas en la columna Origen de valores.

El Asistente para la exportación a base de datos seleccionará automáticamente todas las variables que

coincidan con los campos existentes utilizando la información sobre la tabla de base de datos original

almacenada en el conjunto de datos activo (si está disponible) y/o los nombres de las variables que

Capítulo 3. Archivos de datos 39

coinciden con los nombres de campo. Este emparejamiento inicial automático sólo pretende ser una guía

y permite cambiar la forma en que se hacen coincidir variables con los campos de la base de datos.

Al añadir nuevos registros a una tabla existente, se aplican las siguientes reglas y limitaciones básicas:

vTodos los casos (o todos los casos seleccionados) en el conjunto de datos activo se añaden a la tabla. Si

alguno de estos casos duplica los registros existentes en la base de datos, puede producirse un error si

se encuentra un valor de clave duplicado. Para obtener información sobre cómo exportar sólo los casos

seleccionados, consulte “Selección de casos para exportar” en la página 38.

vPuede utilizar los valores de las variables nuevas creadas en la sesión como los valores de los campos

existentes, pero no puede añadir campos nuevos ni cambiar los nombres de los existentes. Para añadir

nuevos campos a una tabla de base de datos, consulte “Adición de nuevos campos” en la página 39.

vCualquier campo de la base de datos excluido que no coincida con una variable no tendrá ningún

valor para los registros añadidos a la tabla de base de datos. (Si la casilla Origen de valores está vacía,

no habrá ninguna variable que coincida con el campo.)

Creación de una nueva tabla o sustitución de una tabla

Para crear una tabla de base de datos nueva o reemplazar una tabla de base de datos existente:

1. En el panel Seleccionar cómo exportar los datos del asistente para la exportación, seleccione Eliminar

una tabla existente y crear una tabla nueva con el mismo nombre o seleccione Crear una tabla

nueva e introduzca un nombre para la nueva tabla. Si el nombre de la tabla contiene cualquier

carácter diferente a letras, números o un guión bajo, el nombre debe estar entre comillas dobles.

2. Si está reemplazando una tabla existente, en el panel Seleccione una tabla o vista, seleccione la tabla

de base de datos.

3. Arrastre las variables y colóquelas en la columna Variable para guardar.

4. Si lo desea, puede designar variables o campos que definan la clave primaria, cambiar nombres de

campos y cambiar el tipo de datos.

Clave primaria. Para designar variables como la clave primaria de la tabla de base de datos, marque la

casilla de la columna identificada con el icono de llave.

vTodos los valores de la clave primaria deben ser exclusivos, de lo contrario, se producirá un error.

vSi selecciona una única variable como la clave primaria, cada registro (caso) debe tener un valor

exclusivo para esa variable.

vSi selecciona varias variables como clave primaria, esto define una clave primaria compuesta y la

combinación de valores para las variables seleccionadas debe ser exclusiva para cada caso.

Para obtener información sobre nombres de campo y tipos de datos, consulte la sección de creación de

campos de base de datos a partir de variables de IBM SPSS Statistics en “Exportación a base de datos” en

la página 35.

Finalización del Asistente para la exportación a base de datos

El último paso del Asistente para la exportación a base de datos proporciona un resumen de las

especificaciones de exportación.

Resumen

vConjunto de datos. El nombre de la sesión de IBM SPSS Statistics para el conjunto de datos que se

utiliza para exportar datos. Esta información es útil principalmente si existen varios orígenes de datos

abiertos. Un origen de datos abierto con una sintaxis del mandato tiene un nombre de conjunto de

datos solo si se le ha asignado de forma explícita.

vTabla. El nombre de la tabla que se va a modificar o crear.

vCasos para exportar. Se exportan todos los casos o se exportan los casos que se han seleccionado con

una condición de filtro definida anteriormente.

vAcción. Indica cómo se modifica la base de datos (por ejemplo, crear una tablan nueva, añadir campos

o registros a una tabla existente).

40 Guía del usuario de IBM SPSS Statistics 23 Core System

vValores perdidos del usuario. Los valores perdidos del usuario se pueden exportar como valores

válidos o se pueden tratar como valores perdidos del sistema para las variables numéricas y

convertirlos en espacios en blanco para las variables de cadena. Este ajuste se controla en el panel en el

que se seleccionan las variables que se van a exportar.

Carga masiva

Carga masiva. Envía datos a la base de datos en lotes, en lugar de un registro a la vez. Esta acción puede

conseguir que la operación sea mucho más rápida, sobre todo, para archivos de datos grandes.

vTamaño de lote. Especifica el número de registros para enviar en cada lote.

vConfirmación de lote. Confirma los registros en la base de datos en el tamaño del lote especificado.

vEnlace ODBC. Utiliza el método de enlace ODBC para confirmar registros en el tamaño del lote

especificado. Esta opción solo está disponible si la base de datos soporta el enlace ODBC. Esta opción

no está disponible en Mac OS.

–Enlaces por filas. Normalmente, el enlaces por filas mejora la velocidad en comparación con el uso

de inserciones parametrizadas que insertan datos registro a registro.

–Enlace por columnas. El enlace por columnas mejora el rendimiento enlazando cada columna de

base de datos con una matriz de nvalores.

¿Qué desea hacer?

vExportar los datos. Exporta los datos a la base de datos.

vPegar la sintaxis. Pega la sintaxis del comando para exportar los datos a una ventana de sintaxis.

Puede modificar y guardar la sintaxis del comando pegada.

Exportación a IBM SPSS Data Collection

El cuadro de diálogo Exportar a IBM SPSS Data Collection crea archivos de datos IBM SPSS Statistics y

archivos de metadatos IBM SPSS Data Collection que puede utilizar para leer los datos en aplicaciones de

IBM SPSS Data Collection. Resulta particularmente útil cuando los datos van y vienen entre las

aplicaciones de IBM SPSS Statistics y IBM SPSS Data Collection.

Para exportar datos que se van a utilizar en aplicaciones de IBM SPSS Data Collection:

1. En los menús de la ventana del Editor de datos correspondientes al conjunto de datos que contiene

los datos que se desean exportar, seleccione:

Archivo >Exportar a IBM SPSS Data Collection

2. Pulse en Archivo de datos para especificar el nombre y la ubicación del archivo de datos IBM SPSS

Statistics.

3. Pulse en Archivo de metadatos para especificar el nombre y la ubicación del archivo de datos de IBM

SPSS Data Collection.

Para nuevas variables y conjuntos de datos no creados a partir de orígenes de datos de IBM SPSS Data

Collection, los atributos de variable de IBM SPSS Statistics se correlacionan con atributos de metadatos de

IBM SPSS Data Collectionen el archivo de metadatos siguiendo los métodos descritos en la

documentación de SAV DSC en la biblioteca de desarrollo de IBM SPSS Data Collection Developer

Library.

Si el conjunto de datos activo se ha creado a partir de un origen de datos de IBM SPSS Data Collection:

vEl nuevo archivo de metadatos se crea fusionando los atributos de metadatos originales con los

atributos de metadatos de todas las nuevas variables, además de todos los cambios realizados a las

variables originales que puedan afectar a sus atributos de metadatos (por ejemplo, adición o cambios

de las etiquetas de variable).

vPara las variables originales leídas del origen de datos de IBM SPSS Data Collection, todos los atributos

de metadatos no reconocidos por IBM SPSS Statistics se conservan en su estado original. Por ejemplo,

Capítulo 3. Archivos de datos 41

IBM SPSS Statistics convierte las variables de cuadrícula en variables de IBM SPSS Statistics normales,

pero los metadatos que definen dichas variables de cuadrículas se conservan al guardar el nuevo

archivo de metadatos.

vSi los nombres de todas las variables de IBM SPSS Data Collection se cambiaron automáticamente para

que cumpliesen las normas de denominación de variables de IBM SPSS Statistics, el archivo de

metadatos correlaciona los nombres convertidos con los nombres de variable originales de IBM SPSS

Data Collection.

La presencia o ausencia de etiquetas de valor puede afectar a los atributos de metadatos de las variables

y, por tanto, a la manera en que dichas variables son leídas por las aplicaciones de IBM SPSS Data

Collection. Si se han definido etiquetas de valor para algunos valores no perdidos de una variable,

deberán definirse para todos los valores no perdidos de dicha variable ya que, de no ser así, IBM SPSS

Data Collection eliminará los valores no etiquetados al leer el archivo de datos.

Esta característica sólo está disponible con IBM SPSS Statistics instalados en sistemas operativos Microsoft

Windows y sólo están disponibles en el modo de análisis local. Esta característica no está disponible en el

análisis en modo distribuido con el servidor de IBM SPSS Statistics.

Para escribir los archivos de metadatos de IBM SPSS Data Collection, debe tener instalados los siguientes

elementos:

v.NET framework. Para obtener la versión más reciente de .NET framework, vaya a

http://www.microsoft.com/net.

vIBM SPSS Data Collection Survey Reporter Developer Kit. Está disponible una versión instalable de

IBM SPSS Data Collection Survey Reporter Developer Kit con el soporte de instalación.

Exportación a Cognos TM1

Si tiene acceso a una base de datos de IBM Cognos TM1, puede exportar datos de IBM SPSS Statistics a

TM1. Esta característica es particularmente práctica cuando se importan datos de TM1, se transforman o

puntúan los datos en SPSS Statistics y se desea volver a exportar los resultados a TM1.

Importante: Para permitir el intercambio de datos entre SPSS Statistics y TM1, debe copiar los siguientes

tres prcoesos de SPSS Statistics al servidor TM1: ExportToSPSS.pro,ImportFromSPSS.pro,y

SPSSCreateNewMeasures.pro. Para añadir estos procesos al servidor TM1, debe copiarlos en el directorio

de datos del servidor TM1 y reiniciar el servidor TM1. Estos archivos están disponibles desde el

directorio common/scripts/TM1 en el directorio de instalación de SPSS Statistics.

Para exportar datos a TM1:

1. Seleccione en los menús:

Archivo >Exportar >Exportar aCognos TM1

2. Conéctese al sistema de gestión del rendimiento de TM1.

3. Inicie sesión en el servidor TM1.

4. Seleccione el cubo de TM1 donde desea exportar los datos.

5. Especifique las correlaciones de los campos del conjunto de datos activo con las dimensiones y las

mediciones del cubo de TM1.

Sistema PM

El URL del sistema de gestión del rendimiento que contiene el servidor TM1 al cual desea

conectarse. El sistema de gestión del rendimiento se define como un URL único para todos los

servidores TM1. Desde este URL, todos los servidores TM1 que se han instalado y que se están

ejecutando en el entorno se pueden descubrir y están accesibles. Especifique el URL y pulse

Conectar.

Servidor TM1

Cuando se establece la conexión con el sistema de gestión del rendimiento, seleccione el servidor

42 Guía del usuario de IBM SPSS Statistics 23 Core System

que contiene el cubo al que desea exportar los datos y pulse Iniciar sesión. Si no se ha conectado

previamente a este servidor, se le solicita que especifique el nombre de usuario y la contraseña. Si

el servidor utiliza el modo de autenticación 5 (seguridad de IBM Cognos), seleccione el espacio

de nombres que identifica el proveedor de autenticación de seguridad en la lista disponible.

Seleccione un cubo de TM1 para exportar

Lista los nombres de los cubos dentro del servidor TM1 al cual puede exportar datos. Seleccione

un cubo y pulse la flecha hacia la derecha para moverlo al campo Exportar a cubo.

Nota:

vEn la exportación se ignoran los valores que faltan del sistema y los valores que faltan del usuario de

campos que se han correlacionado con elementos en la medición y la dimensión del cubo de TM1. Las

casillas asociadas en el cubo de TM1 no se modifican.

vLos campos con un valor de cero, que se han correlacionado con elementos en la dimensión de

medida, se exportan como un valor válido.

Correlación de campos con dimensiones de TM1

Utilice la pestaña Correlación en el cuadro de diálogo Exportar a TM1 para correlacionar campso de SPSS

Statistics con las dimensiones y las mediciones asociadas de IBM Cognos TM1. Puede correlacionarse con

elementos existente en la dimensión de medida o puede crear elementos nuevos en la dimensión de

medida del cubo de TM1.

vPara cada dimensión regular del cubo de TM1 especificado, debe correlacionar un campo en el

conjunto de datos activo con la dimensión o especificar una porción de la dimensión. Una porción

especifica un elemento de una sola hoja de una dimensión, de forma que todos los casos exportados se

asocian al elemento de hoja especificado.

vPara un campo que está correlacionado con una dimensión regular, no se exportan los casos con

valores de campo que no coinciden con un elemento de hoja en la dimensión especificada. En este

sentido, solo puede exportar a elementos de hoja.

vSolo los campos de serie del conjunto de datos activo se pueden correlacionar con dimensiones

regulares. Solo los campos numéricos del conjunto de datos activo se pueden correlacionar con

elementos en la dimensión de medida del cubo.

vLos valores que se exportan a un elemento existente en la dimensión de medida sobrescriben las

casillas asociadas en el cubo de TM1.

Para correlacionar un campo de SPSS Statistics con una dimensión TM1 regular o con un elemento

existente en la dimensión de medida:

1. Seleccione el campo de SPSS Statistics en la lista Campos.

2. Seleccione la dimensión o medición de TM1 asociada en la lista Dimensiones de TM1.

3. Pulse Correlacionar.

Para correlacionar un campo de SPSS Statistics con un elemento nuevo en la dimensión de medida:

1. Seleccione el campo de SPSS Statistics en la lista Campos.

2. Seleccione el elemento para la dimensión de medida en la lista Dimensiones de TM1.

3. Pulse Crear nuevo, especifique el nombre del elemento de medida en el diálogo Nombre de medida

de TM1 y pulse Aceptar.

Para especificar una porción para una dimensión regular:

1. Seleccione la dimensión en la lista Dimensiones de TM1.

2. Pulse Crear porción en.

3. En el diálogo Seleccionar miembro de hoja, seleccione el elemento que especifica la porción y, a

continuación, pulse Aceptar. Puede buscar un elemento específico especificando una cadena de

búsqueda en el cuadro de texto Buscar y pulsando Buscar siguiente. Se encuentra una coincidencia si

alguna de la parte de un elemento coincide con la cadena de búsqueda.

Capítulo 3. Archivos de datos 43

vLos espacios incluidos en la cadena de búsqueda se incluyen en la búsqueda.

vLas búsquedas no distinguen entre mayúsculas y minúsculas.

vEl asterisco (*) se trata como cualquier otro carácter y no indica una búsqueda comodín.

Puede eliminar una definición de correlación seleccionando el elemento correlacionado en la lista

Dimensiones de TM1 y pulsando Eliminar correlación. Puede suprimir la especificación de una medida

nueva seleccionando la medida en la lista Dimensiones de TM1 y pulsando Suprimir.

Comparación de conjuntos de datos

La función de comparación de conjuntos de datos compara el conjunto de datos activo con otro conjunto

de datos en la sesión actual o en un archivo externo en formato IBM SPSS Statistics.

Para comparar conjuntos de datos

1. Abra un archivo de datos y asegúrese de que es el conjunto de datos activo. (Puede convertir el

conjunto de datos activo haciendo clic en la ventana Editor de datos de ese conjunto de datos.)

2. Elija en los menús:

Datos >Comparar conjuntos de datos

3. Seleccione el conjunto de datos abierto o el archivo de datos de IBM SPSS Statistics que desea

comparar con el conjunto de datos activo.

4. Seleccione uno o más campos (variables) que desee comparar.

Si lo desea, puede:

vComparar los casos (registros) basados en uno o más valores de ID de caso.

vComparar propiedades de diccionario de datos (etiquetas de campos y valores, valores perdidos del

usuario, nivel de medición, etc).

vCrear un campo de distintivo en el conjunto de datos activo que identifica los casos no

correspondientes.

vCrear nuevos conjuntos de datos que solo contienen casos coincidentes o solo casos que no coinciden.

Comparar conjuntos de datos: pestaña Comparar

La lista de campos coincidentes muestra una lista de los campos con el mismo nombre y el mismo tipo

básico (cadena o numérica) en ambos conjuntos de datos.

1. Seleccione uno o más campos (variables) para comparar. La comparación de los dos conjuntos de

datos se basa en los campos seleccionados únicamente.

2. Para ver una lista de campos que no tienen nombres coincidentes o que no tienen el mismo tipo

básico en ambos conjuntos de datos, haga clic en Campos no coincidentes. Los campos no

coincidentes se excluyen de la comparación de los dos conjuntos de datos.

3. También puede seleccionar uno o más campos de ID de casos (registros) que identifiquen a cada caso.

vSi especifica varios campos de ID de casos, cada combinación exclusiva de valores identifica un caso.

vAmbos archivos se deben clasificar en orden ascendente en los campos de ID de casos. Si los conjuntos

de datos no están aún ordenados, seleccione (marque) Ordenar casos para ordenar ambos conjuntos de

datos en el orden de ID de casos.

vSi no incluye ninguno de los campos de ID de casos, estos se compararán en el orden de los archivos.

Es decir, el primer caso (registro) del conjunto de datos activo se compara con el primero caso del otro

conjunto de datos, y así sucesivamente.

Comparar conjuntos de datos: campos no coincidentes

El cuadro de diálogo Campos no coincidentes muestra una lista de campos (variables) que se consideran

no coincidentes en los dos conjuntos de datos. Un campo no coincidente es un campo que falta de uno

44 Guía del usuario de IBM SPSS Statistics 23 Core System

de los conjuntos de datos que no es del mismo tipo básico (cadena o numérico) en ambos archivos. Los

campos no coincidentes se excluyen de la comparación de los dos conjuntos de datos.

Comparar conjuntos de datos: pestaña Atributos

De forma predeterminada, solo se comparan valores de datos y los atributos de campo (propiedades de

diccionario de datos) como etiquetas de valores, valores perdidos del usuario y nivel de medición no se

comparan. Para comparar atributos de campo:

1. En el cuadro de diálogo Comparar conjuntos de datos, haga clic la pestaña Atributos.

2. Haga clic para comparar los diccionarios de datos.

3. Seleccione los atributos que desea comparar.

vAmplitud. En campos numéricos, el número máximo de caracteres que se muestra (dígitos y caracteres

de formato, como símbolos de divisa, símbolos de agrupación e indicador decimal). En los campos de

cadena, se permite el número máximo de bytes.

vEtiqueta. Etiqueta descriptiva de campo.

vEtiqueta de valor. Etiquetas descriptivas de valores.

vPerdidos. Valores perdidos del usuario.

vColumnas. Ancho de columna en la vista de datos del editor de datos.

vAlineación. Alineación en la vista de datos del editor de datos.

vMedida. Nivel de medición.

vPapel. Papel del campo.

vAtributos. Atributos de campo personalizado definidos por el usuario.

Comparación de conjuntos de datos: pestaña Resultados

De forma predeterminada, Comparar conjuntos de datos crea un nuevo campo en el conjunto de datos

activo que identifica casos que no coinciden y produce una tabla que proporciona detalles de los 100

primeros casos no coincidentes. Puede utilizar la pestaña Resultados para cambiar las opciones de

resultados.

Señalar las no coincidencias en un campo nuevo. Un nuevo campo que identifica casos no coincidentes

que se crean en el conjunto de datos activo.

vEl valor de este campo nuevo es 1 si existen diferenciasy0sitodos los valores son los mismos. Si

existen casos (registros) en el conjunto de datos activo que no están presentes en el otro conjunto de

datos, el valor es -1.

vEl nombre predeterminado del nuevo campo es CompararCasos. Puede especificar un nombre de campo

diferente. El nombre debe cumplir las normas de denominación de campos (variables). Consulte el

tema “Nombres de variable” en la página 56 para obtener más información.

Copiar casos coincidentes a un nuevo conjunto de datos. Crea un nuevo conjunto de datos que solo

contienen casos (registros) del conjunto de datos activo que tienen valores coincidentes en el otro

conjunto de datos. El nombre del conjunto de datos debe cumplir las normas de denominación de

campos (variables). Si el conjunto de datos ya existe, se sobrescribirá.

Copiar casos no coincidentes a un nuevo conjunto de datos. Crea un nuevo conjunto de datos que solo

contienen casos del conjunto de datos activo que tienen valores diferentes en el otro conjunto de datos. El

nombre del conjunto de datos debe cumplir las normas de denominación de campos (variables). Si el

conjunto de datos ya existe, se sobrescribirá.

Limitar la tabla caso por caso. En los casos (registros) en el conjunto de datos activo que también existen

en el otro conjunto de datos y también tienen el mismo tipo básico (cadena o numérico) en ambos

conjuntos de datos, la tabla de caso por caso proporciona información sobre los valores no coincidentes

Capítulo 3. Archivos de datos 45

de cada caso. De forma predeterminada, la tabla está limitada a los 100 primeros elementos no

coincidentes. Puede especificar un valor diferente o cancelar la selección (desmarcar) este elemento para

que incluya todos los elementos no coincidentes.

Protección de datos originales

Para evitar la modificación o eliminación accidental de los datos originales, puede marcar el archivo

como un archivo de sólo lectura.

1. En los menús del Editor de datos, elija:

Archivo >Marcar archivo como de sólo lectura

Si hace modificaciones posteriores de los datos y, a continuación, intenta guardar el archivo de datos,

puede guardar los datos sólo con un nombre de archivo distinto; así, los datos originales no se verán

afectados.

Puede restablecer los permisos de archivo a lectura/escritura seleccionando la opción Marcar archivo

como de lectura/escritura en el menú Archivo.

Archivo activo virtual

El archivo activo virtual permite trabajar con grandes archivos de datos sin que sea necesaria una

cantidad igual de grande (o mayor) de espacio temporal en disco. Para la mayoría de los procedimientos

de análisis y gráficos, el origen de datos original se vuelve a leer cada vez que se ejecuta un

procedimiento diferente. Los procedimientos que modifican los datos necesitan una cierta cantidad de

espacio temporal en disco para realizar un seguimiento de los cambios; además, algunas acciones

necesitan disponer siempre de la cantidad suficiente de espacio en disco para, al menos, una copia

completa del archivo de datos.

Las acciones que no necesitan ningún espacio temporal en disco son:

vLectura de archivos de datos de IBM SPSS Statistics

vLa fusión de dos o más archivos de datos IBM SPSS Statistics

vLa lectura de tablas de bases de datos con el Asistente para bases de datos

vFusión de archivos de datos IBM SPSS Statistics con tablas de bases de datos

vLa ejecución de procedimientos que leen datos (por ejemplo, Frecuencias, Tablas cruzadas, Explorar)

Las acciones que crean una o más columnas de datos en espacio temporal en disco son:

vEl cálculo de nuevas variables

vLa recodificación de variables existentes

vLa ejecución de procedimientos que crean o modifican variables (por ejemplo, almacenamiento de

valores pronosticados en Regresión lineal)

Las acciones que crean una copia completa del archivo de datos en espacio temporal en disco son:

vLa lectura de archivos de Excel

vLa ejecución de procedimientos que ordenan los datos (por ejemplo, Ordenar casos, Segmentar archivo)

vLa lectura de datos con los comandos GET TRANSLATE oDATA LIST

vLa utilización de la unidad Datos de caché o el comando CACHE

vLa activación de otras aplicaciones de IBM SPSS Statistics que leen el archivo de datos (por ejemplo,

AnswerTree, DecisionTime)

Nota: el comando GET DATA proporciona una funcionalidad comparable a DATA LIST, sin crear una copia

completa del archivo de datos en el espacio temporal del disco. El comando SPLIT FILE de la sintaxis de

46 Guía del usuario de IBM SPSS Statistics 23 Core System

comandos no ordena el archivo de datos y por lo tanto no crea una copia del archivo de datos. Este

comando, sin embargo, necesita tener los datos ordenados para un funcionamiento apropiado y la

interfaz del cuadro de diálogo para este procedimiento ordenará de forma automática el archivo de datos,

con la consiguiente copia completa de dicho archivo. En la versión para estudiantes no está disponible la

sintaxis de comandos.

Acciones que crean una copia completa del archivo de datos de forma predeterminada:

vLectura de bases de datos con el Asistente para bases de datos

vLa lectura de archivos de texto con el Asistente para la importación de texto

El Asistente para la importación de texto proporciona un ajuste opcional para crear de forma automática

una caché de los datos. De forma predeterminada, se selecciona esta opción. Para desactivar esta opción,

simplemente desmarque la casilla de verificación Caché local de los datos. En el Asistente para bases de

datos puede pegar la sintaxis de comando generada y eliminar el comando CACHE.

Creación de una caché de datos

Aunque el archivo actual virtual puede reducir de forma drástica la cantidad de espacio temporal en

disco necesario, la falta de una copia temporal del archivo “activo” significa que el origen original de

datos debe volver a leerse para cada procedimiento. Para archivos de datos grandes leídos desde un

origen externo, la creación de una copia temporal de los datos puede mejorar el rendimiento. Por

ejemplo, para tablas de datos leídas desde un origen de base de datos, la consulta SQL que lee la

información de la base de datos debe volver a ejecutarse para cualquier comando o procedimiento que

necesite leer los datos. Debido a que virtualmente todos los procedimientos de análisis estadísticos y

procedimientos gráficos necesitan leer los datos, la ejecución de la consulta SQL se repite para cada

procedimiento, lo que puede significar un importante incremento en el tiempo de procesamiento si se

ejecuta un gran número de procedimientos.

Si se dispone de suficiente espacio en disco en el ordenador que realiza el análisis (el ordenador local o el

servidor remoto), se pueden eliminar varias consultas SQL y mejorar el tiempo de procesamiento

mediante la creación de una caché de datos del archivo activo. La caché de datos es una copia temporal

de todos los datos.

Nota: de forma predeterminada, el Asistente para bases de datos crea de forma automática una caché de

datos, pero si se utiliza el comando GET DATA en la sintaxis de comandos para leer una base de datos, no

se creará una caché de datos de forma automática. En la versión para estudiantes no está disponible la

sintaxis de comandos.

Para crear una caché de datos

1. Elija en los menús:

Archivo >Caché de los datos...

2. Pulse en Aceptar oenCrear caché ahora.

Aceptar crea una caché de datos la siguiente vez que el programa lea los datos (por ejemplo, la próxima

vez que se ejecute un procedimiento estadístico), que será lo que normalmente se quiera porque no

necesita una lectura adicional de los datos. Crear caché ahora crea una caché de datos inmediatamente, lo

cual no será necesario la mayoría de las veces. Crear caché ahora se utiliza principalmente por dos

razones:

vUn origen de datos está “bloqueado” y no se puede actualizar por nadie hasta que finalice la sesión

actual, abra un origen de datos diferente o haga una caché de los datos.

vPara grandes orígenes de datos, el desplazamiento por el contenido de la pestaña Vista de datos en el

Editor de datos será mucho más rápido si se hace una caché de datos.

Capítulo 3. Archivos de datos 47

Para crear una caché de datos de forma automática

Se puede utilizar el comando SET para crear de forma automática una caché de datos después de un

número especificado de cambios en el archivo de datos activo. De forma predeterminada, se crea una

caché del archivo de datos de forma automática cada 20 cambios realizados sobre el archivo.

1. Elija en los menús:

Archivo >Nuevo >Sintaxis

2. En la ventana de sintaxis, escriba SET CACHE n (donde nrepresenta el número de cambios realizados

en el archivo de datos activo antes de crear una caché del archivo).

3. En los menús de la ventana de sintaxis, elija:

Ejecutar >Todo

Nota: El ajuste de la caché no se almacena entre sesiones. Cada vez que se inicia una nueva sesión, se

toma el valor predeterminado de la opción que es 20.

48 Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 4. Análisis en modo distribuido

El análisis en modo distribuido permite utilizar un ordenador que no es el local (o de escritorio) para

realizar trabajos que requieren un gran consumo de memoria. Debido a que los servidores remotos

utilizados para análisis distribuidos son normalmente más potentes y rápidos que los ordenadores

locales, un análisis en modo distribuido puede reducir significativamente el tiempo de procesamiento del

ordenador. El análisis distribuido con un servidor remoto puede ser útil si el trabajo trata:

vArchivos de datos, en particular lecturas de datos de orígenes de bases de datos.

vTareas que requieren un gran consumo de memoria. Cualquier tarea que tarde bastante tiempo en el

análisis en modo local será una buena candidata para el análisis distribuido,

El análisis distribuido sólo afecta a las tareas relacionadas con los datos, como lectura de datos,

transformación de datos, cálculo de nuevas variables y cálculo de estadísticos. El análisis distribuido no

tiene ningún efecto sobre tareas relacionadas con la edición de resultados, como la manipulación de

tablas dinámicas o la modificación de gráficos.

Nota: el análisis distribuido sólo está disponible si dispone tanto de una versión local como de acceso a

una versión de servidor con licencia del software instalado en un servidor remoto.

Acceso al servidor

El cuadro de diálogo Acceso al servidor permite seleccionar el ordenador para procesar comandos y

ejecutar procedimientos. Puede seleccionar el ordenador local o un servidor remoto.

Se pueden añadir, modificar o eliminar servidores remotos de la lista. Los servidores remotos requieren

normalmente un ID de usuario y una contraseña; también puede ser necesario un nombre de dominio. Si

tiene licencia para utilizar Statistics Adapter y su sitio ejecuta IBM SPSS Collaboration and Deployment

Services es posible que pueda conectarse a un servidor remoto mediante inicio de sesión único. El inicio

de sesión único permite a los usuarios conectarse a un servidor remoto sin proporcionar explícitamente

una ID de usuario y una contraseña. La autenticación necesaria se realiza con las credenciales del usuario

actual en el equipo actual, que se obtiene, por ejemplo, de Windows Active Directory. Póngase en

contacto con el administrador del sistema para obtener información acerca de servidores, ID de usuario y

contraseñas, nombres de dominio disponibles y demás información necesaria para la conexión,

incluyendo si el inicio de sesión único es compatible en su sitio.

Puede seleccionar un servidor predeterminado y guardar el ID de usuario, nombre de dominio y

contraseña asociados a cualquier servidor. De esta manera, se conectará de forma automática al servidor

predeterminado en el momento de iniciar la sesión.

Importante: puede conectarse a un servidor que no sea del mismo nivel de versión que el cliente. El

servidor puede ser uno o des versiones más moderno o más antiguo que el cliente. Sin embargo, no se

recomienda mantener esta configuración durante más tiempo. Si el servidor es más moderno que el

cliente, el servidor puede generar resultados que no pueda leer el cliente. Si el cliente es más moderno

que el servidor, es posible que el servidor no reconozca la sintaxis enviada por el cliente. Por lo tanto,

debería ponerse en contacto con su administrador para saber cómo conectarse a un servidor que tiene la

misma versión que el cliente.

Si tiene licencia para utilizar Statistics Adapter y su sitio ejecuta IBM SPSS Collaboration and Deployment

Services 3.5 o posterior, puede pulsar en Búsqueda... para ver una lista de servidores disponibles en su

red. Si no ha iniciado sesión en IBM SPSS Collaboration and Deployment Services Repository, se le

solicitará que introduzca la información de conexión antes de poder ver la lista de servidores.

Adición y edición de la configuración de acceso al servidor

Utilice el cuadro de diálogo Configuración del acceso al servidor para añadir o editar la información de

conexión para servidores remotos para utilizar en los análisis en modo distribuido.

Para obtener una lista de servidores disponibles, los números de puerto para dichos servidores y toda la

información adicional necesaria para la conexión, póngase en contacto con el administrador del sistema.

No utilice el Nivel de socket seguro a menos que lo indique el administrador.

Nombre del servidor. Un “nombre” de servidor puede ser un nombre alfanumérico asignado a un

ordenador (por ejemplo, ServidorRed) o una dirección IP exclusiva asignada a un ordenador (por

ejemplo, 202.123.456.78).

Número de puerto. El número de puerto es el puerto que el software del servidor utiliza para las

comunicaciones.

Descripción. Puede introducir una descripción opcional para que se visualice en la lista de servidores.

Conectar con Nivel de socket seguro. Las encriptaciones de Nivel de socket seguro (SSL) requieren el

análisis distribuido cuando se envían al servidor remoto. Antes de utilizar el SSL, consulte con el

administrador. Para que esta opción se active, SSL debe estar configurado en su equipo de escritorio y en

el servidor.

Para seleccionar, cambiar o añadir servidores

1. Elija en los menús:

Archivo >Cambiar servidor...

Para seleccionar un servidor predeterminado:

2. En la lista de servidores, seleccione la casilla que se encuentra junto al servidor que desea utilizar.

3. Si el servidor está configurado para el inicio de sesión único, asegúrese de que Establecer

credenciales no está seleccionada. De lo contrario, seleccione Establecer credenciales e introduzca el

ID de usuario, nombre de dominio y contraseña suministrados por el administrador.

Nota: de esta manera, se conectará de forma automática al servidor predeterminado en el momento

de iniciar la sesión.

Para cambiar a otro servidor:

4. Seleccione el servidor de la lista.

5. Si el servidor está configurado para el inicio de sesión único, asegúrese de que Establecer

credenciales no está seleccionada. De lo contrario, seleccione Establecer credenciales e introduzca el

ID de usuario, nombre de dominio y contraseña (si fuera necesario).

Nota: al cambiar de servidor durante una sesión, se cierran todas las ventanas abiertas. Se solicitará

guardar los cambios antes de que se cierren las ventanas.

Para añadir un servidor:

6. Solicite al administrador la información de conexión del servidor.

7. Pulse en Añadir para abrir el cuadro de diálogo Configuración del acceso al servidor.

8. Introduzca la información de conexión y la configuración opcional y pulse en Aceptar.

Para editar un servidor:

9. Solicite al administrador la información de conexión revisada.

10. Pulse en Editar para abrir el cuadro de diálogo Configuración del acceso al servidor.

11. Introduzca los cambios y pulse en Aceptar.

Para buscar servidores disponibles:

50 Guía del usuario de IBM SPSS Statistics 23 Core System

Nota: la capacidad para buscar servidores disponibles sólo está disponible si tiene licencia para

utilizar Statistics Adapter si su sitio ejecuta IBM SPSS Collaboration and Deployment Services 3.5 o

posterior.

12. Pulse en Buscar... para abrir el cuadro de diálogo Buscar servidores. Si no está conectado a IBM SPSS

Collaboration and Deployment Services Repository, se le solicitará información de conexión.

13. Seleccione uno o varios servidores disponibles y pulse en Aceptar. Los servidores se mostrarán en el

cuadro de diálogo Acceso al servidor.

14. Para conectar con uno de los servidores siga las indicaciones para cambiar a otro servidor.

Búsqueda de servidores disponibles

Utilice el cuadro de diálogo Buscar servidores para elegir uno o varios servidores disponibles en la red.

Este cuadro de diálogo aparece al pulsar en Buscar... en el cuadro de diálogo Acceso al servidor.

Seleccione uno o más servidores y pulse en Aceptar para añadirlos al cuadro de diálogo Acceso al

servidor. Aunque es posible añadir servidores manualmente al cuadro de diálogo Acceso al servidor, la

opción de búsqueda de servidores disponibles permite conectar con los servidores sin necesidad de

conocer el nombre correcto y número de puerto del servidor. Esta información se proporciona

automáticamente. No obstante, deberá disponer de la información de inicio de sesión correcta, como

nombre de usuario, dominio y contraseña.

Apertura de archivos de datos desde un servidor remoto

En el análisis en modo distribuido, el cuadro de diálogo Abrir archivo remoto sustituye al cuadro de

diálogo estándar Abrir archivo.

vEl contenido de la lista de archivos, carpetas y unidades muestra lo que hay disponible en o desde el

servidor remoto. En la parte superior del cuadro de diálogo se indica el nombre del servidor actual.

vEn el análisis en modo distribuido, sólo tendrá acceso a los archivos del equipo local si especifica la

unidad como un dispositivo compartido y las carpetas que contienen los archivos de datos como

carpetas compartidas. Consulte la documentación de su sistema operativo para obtener información

sobre cómo "compartir" carpetas del equipo local con la red del servidor.

vSi el servidor está ejecutando un sistema operativo diferente (por ejemplo, usted dispone de Windows

y el servidor se ejecuta bajo UNIX), probablemente no dispondrá de acceso a los archivos de datos

locales en el análisis en modo distribuido, aunque los archivos estén en carpetas compartidas.

Acceso a archivo en análisis en modo local y distribuido

La presentación de carpetas de datos (directorios) y las unidades para el ordenador local y la red está en

función del ordenador que está utilizando para procesar comandos y ejecutar procedimientos, que no es

necesariamente el ordenador que tiene delante.

Análisis en modo local. Cuando utiliza el ordenador local como el "servidor", la visualización de los

archivos de datos, las carpetas y las unidades que ve en el cuadro de diálogo de acceso a los archivos

(para la apertura de archivos de datos) es similar a lo que ve en otras aplicaciones o en el Explorador de

Windows. Se pueden ver todos los archivos de datos y las carpetas en el ordenador y cualquier archivo y

carpeta en las unidades de red.

Análisis en modo distribuido. Cuando utiliza otro ordenador como “servidor remoto” para ejecutar

comandos y procedimientos, la visualización de los archivos de datos y las unidades representa la vista

desde el servidor remoto. Aunque vea nombres de carpetas que le son familiares (como Archivos de

programas y unidades como C), estas no son las carpetas y unidades del ordenador local, sino las del

servidor remoto.

En el análisis en modo distribuido, sólo tendrá acceso a los archivos de datos del equipo local si

especifica la unidad como un dispositivo compartido y las carpetas que contienen los archivos de datos

Capítulo 4. Análisis en modo distribuido 51

como carpetas compartidas. Si el servidor está ejecutando un sistema operativo diferente (por ejemplo,

usted dispone de Windows y el servidor se ejecuta bajo UNIX), probablemente no dispondrá de acceso a

los archivos de datos locales en el análisis en modo distribuido, aunque los archivos estén en carpetas

compartidas.

El análisis en modo distribuido no es lo mismo que acceder a archivos de datos que se encuentran en

otro ordenador de la red. Se puede acceder a archivos de datos en otros dispositivos de red tanto en

análisis en modo local como en análisis en modo distribuido. En modo local, se accede a otros

dispositivos desde el ordenador local. En el modo distribuido, se accede a otros dispositivos de red desde

el servidor remoto.

Si no está seguro de si está utilizando el análisis en modo local o distribuido, mire la barra de título en el

cuadro de diálogo para acceder a archivos de datos. Si el título del cuadro de diálogo contiene la palabra

remoto (como en Abrir archivo remoto) o si el texto Servidor remoto: [nombre de servidor] aparece en la

parte superior del cuadro de diálogo, estará utilizando el modo de análisis distribuido.

Nota: esta situación afecta sólo a los cuadros de diálogo para acceder a archivos de datos (por ejemplo,

Abrir datos, Guardar datos, Abrir base de datos y Aplicar diccionario de datos). Para todos los demás

tipos de archivos (por ejemplo, archivos del Visor, archivos de sintaxis y archivos de scripts) se utiliza la

visualización local.

Disponibilidad de procedimientos en análisis en modo distribuido

En el análisis en modo distribuido, estarán disponibles sólo aquellos procedimientos instalados en la

versión local y en la versión del servidor remoto.

Si dispone de componentes opcionales instalados en el ordenador local que no están disponibles en el

servidor remoto, y cambia del ordenador local a un servidor remoto, los procedimientos afectados se

eliminarán de los menús y la sintaxis de comandos relacionada generará errores. Todos los

procedimientos afectados se restaurarán al cambiar de nuevo al modo local.

Especificaciones de rutas absolutas frente a rutas relativas

En el modo de análisis distribuido, las especificaciones de las rutas relativas para los archivos de datos y

los archivos de sintaxis de comandos son relativas al servidor actual, no al equipo local. Una

especificación de ruta de acceso como /misdocs/misdatos.sav no indica un directorio y archivo en la unidad

local, sino que indica un directorio y archivo en el disco duro del servidor remoto.

Especificaciones de ruta de acceso UNC para Windows

Si utiliza la versión de servidor para Windows, puede usar las especificaciones de la UNC (convención de

denominación universal) al acceder a los archivos de datos y sintaxis mediante la sintaxis de comandos.

El formato general de una especificación UNC es:

\\servername\sharename\path\filename

vNombre_servidor es el nombre del ordenador que contiene el archivo de datos.

vNombre_compartido es la carpeta (directorio) en el ordenador que aparece designada como una carpeta

compartida.

vRuta es cualquier ruta de acceso de carpetas (subdirectorios) por debajo de la carpeta compartida.

vNombre_archivo es el nombre del archivo de datos.

A continuación se muestra un ejemplo:

GET FILE=’\\hqdev001\public\july\sales.sav’.

52 Guía del usuario de IBM SPSS Statistics 23 Core System

Si el ordenador no tiene un nombre asignado, puede utilizar su dirección IP, como en:

GET FILE=’\\204.125.125.53\public\july\sales.sav’.

Incluso con especificaciones de ruta de acceso UNC, sólo se puede acceder a archivos de datos y de

sintaxis que estén en carpetas y dispositivos compartidos. Cuando se utiliza análisis en modo distribuido,

esta situación incluye archivos de datos y de sintaxis del ordenador local.

Especificaciones de rutas absolutas para UNIX

En las versiones de servidor para UNIX, no hay un equivalente a las rutas UNC y todas las rutas de

acceso de los directorios deben ser rutas absolutas que comienzan en la raíz del servidor; las rutas

relativas no están permitidas. Por ejemplo, si el archivo de datos está ubicado en /bin/data y el directorio

actual también es /bin/data, la sintaxis GET FILE=’sales.sav’ no es válida; debe especificar la ruta

completa, como en:

GET FILE=’/bin/sales.sav’.

INSERT FILE=’/bin/salesjob.sps’.

Capítulo 4. Análisis en modo distribuido 53

54 Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 5. Editor de datos

El Editor de datos proporciona un método práctico (al estilo de las hojas de cálculo) para la creación y

edición de archivos de datos. La ventana Editor de datos se abre automáticamente cuando se inicia una

sesión.

El Editor de datos proporciona dos vistas de los datos.

vVista de datos. Esta vista muestra los valores de datos reales o las etiquetas de valor definidas.

vVista de variables. Esta vista muestra la información de definición de las variables, que incluye las

etiquetas de la variable definida y de valor, tipo de dato (por ejemplo, cadena, fecha o numérico), nivel

de medición (nominal, ordinal o de escala) y los valores perdidos del usuario.

En ambas vistas, se puede añadir, modificar y eliminar la información contenida en el archivo de datos.

Vista de datos

Muchas de las características de la Vista de datos son similares a las que se encuentran en aplicaciones de

hojas de cálculo. Sin embargo, existen varias diferencias importantes:

vLas filas son casos. Cada fila representa un caso o una observación. Por ejemplo, cada individuo que

responde a un cuestionario es un caso.

vLas columnas son variables. Cada columna representa una variable o una característica que se mide.

Por ejemplo, cada elemento en un cuestionario es una variable.

vLas casillas contienen valores. Cada casilla contiene un valor único de una variable para cada caso. La

casilla se encuentra en la intersección del caso y la variable. Las casillas sólo contienen valores de

datos. A diferencia de los programas de hoja de cálculo, las casillas del Editor de datos no pueden

contener fórmulas.

vEl archivo de datos es rectangular. Las dimensiones del archivo de datos vienen determinadas por el

número de casos y de variables. Se pueden introducir datos en cualquier casilla. Si introduce datos en

una casilla fuera de los límites del archivo de datos definido, el rectángulo de datos se ampliará para

incluir todas las filas y columnas situadas entre esa casilla y los límites del archivo. No hay casillas

“vacías” en los límites del archivo de datos. Para variables numéricas, las casillas vacías se convierten

en el valor perdido del sistema. Para variables de cadena, un espacio en blanco se considera un valor

válido.

Vista de variables

La Vista de variables contiene descripciones de los atributos de cada variable del archivo de datos. En la

Vista de variables:

vLas filas son variables.

vLas columnas son atributos de las variables.

Se pueden añadir o eliminar variables, y modificar los atributos de las variables, incluidos los siguientes:

vNombre de variable

vTipo de dato

vNúmero de dígitos o caracteres

vNúmero de decimales

vLas etiquetas descriptivas de variable y de valor

vValores perdidos del usuario

vAncho de columna

vNivel de medición

Todos estos atributos se guardan al guardar el archivo de datos.

Además de la definición de propiedades de variables en la Vista de variables, hay dos otros métodos

para definir las propiedades de variables:

vEl Asistente para la copia de propiedades de datos ofrece la posibilidad de utilizar un archivo de datos

IBM SPSS Statistics externo u otro conjunto de datos que esté disponible en la sesión actual como

plantilla para definir las propiedades del archivo y las variables del conjunto de datos activo. También

puede utilizar variables del conjunto de datos activo como plantillas para otras variables del conjunto

de datos activo. La opción Copiar propiedades de datos está disponible en el menú Datos en la

ventana Editor de datos.

vLa opción Definir propiedades de variables (también disponible en el menú Datos de la ventana Editor

de datos) explora los datos y muestra una lista con todos los valores de datos exclusivos para las

variables seleccionadas, indica los valores sin etiquetas y ofrece una característica de etiquetas

automáticas. Este método es especialmente útil para las variables categóricas que utilizan códigos

numéricos para representar las categorías (por ejemplo, 0 = hombre,1=mujer.

Para visualizar o definir los atributos de las variables

1. Haga que el editor de datos sea la ventana activa.

2. Pulse dos veces en un nombre de variable en la parte superior de la columna en la Vista de datos o

bien pulse en la pestaña Vista de variables.

3. Para definir variables nuevas, introduzca un nombre de variable en cualquier fila vacía.

4. Seleccione los atributos que desea definir o modificar.

Nombres de variable

Para los nombres de variable se aplican las siguientes normas:

vCada nombre de variable debe ser exclusivo; no se permiten duplicados.

vLos nombres de variable pueden tener una longitud de hasta 64 bytes y el primer carácter debe ser una

letra o uno de estos caracteres: @,#o$.Loscaracteres posteriores puede ser cualquier combinación de

letras, números, caracteres que no sean signos de puntuación y un punto (.). En el modo de página de

código, sesenta y cuatro bytes suelen equivaler a 64 caracteres en idiomas de un solo byte (por

ejemplo, inglés, francés, alemán, español, italiano, hebreo, ruso, griego, árabe y tailandés) y 32

caracteres en los idiomas de dos bytes (por ejemplo, japonés, chino y coreano). Muchos caracteres de

una cadena ocuparán un solo byte en el modo de página de código y dos o más bytes en el modo

Unicode. Por ejemplo, é ocupa un byte en el formato de página de código pero dos bytes en el formato

Unicode; por lo que résumé ocupa seis bytes en un archivo de página de código y ocho bytes en modo

Unicode.

Nota: las letras incluyen todos los caracteres que no son signos de puntuación y se utilizan al escribir

palabras normales en los idiomas admitidos en el juego de caracteres de la plataforma.

vLas variables no pueden contener espacios.

vUn carácter # en la primera posición de un nombre de variable define una variable transitorio. Sólo

puede crear variables transitorios mediante la sintaxis de comandos. No puede especificar un # como

primer carácter de una variable en los cuadros de diálogo que permiten crear nuevas variables.

vUn signo $ en la primera posición indica que la variable es una variable del sistema. El signo $ no se

admite como carácter inicial de una variable definida por el usuario.

vEl punto, el subrayado y los caracteres $,#y@sepueden utilizar dentro de los nombres de variable.

Por ejemplo, A._$@#1 es un nombre de variable válido.

vSe deben evitar los nombres de variable que terminan con un punto, ya que el punto puede

interpretarse como un terminador del comando. Sólo puede crear variables que finalicen con un punto

en la sintaxis de comandos. No puede crear variables que terminen con un punto en los cuadros de

diálogo que permiten crear nuevas variables.

56 Guía del usuario de IBM SPSS Statistics 23 Core System

vSe deben evitar los nombres de variable que terminan con un carácter de subrayado, ya que tales

nombres puede entrar en conflicto con los nombres de variable creados automáticamente por

comandos y procedimientos.

vLas palabras reservadas no se pueden utilizar como nombres de variable. Las palabras reservadas son

ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, TO y WITH.

vLos nombres de variable se pueden definir combinando de cualquier manera caracteres en mayúsculas

y en minúsculas, esta distinción entre mayúsculas y minúsculas se conserva en lo que se refiere a la

presentación.

vCuando es necesario dividir los nombres largos de variable en varias líneas en los resultados, las líneas

se dividen aprovechando los subrayados, los puntos y cuando el contenido cambia de minúsculas a

mayúsculas.

Nivel de medición de variable

Puede especificar el nivel de medición como Escala (datos numéricos de una escala de intervalo o de

razón), Ordinal o Nominal. Los datos nominales y ordinales pueden ser de cadena (alfanuméricos) o

numéricos.

vNominal. Una variable puede ser tratada como nominal cuando sus valores representan categorías que

no obedecen a una clasificación intrínseca. Por ejemplo, el departamento de la compañía en el que

trabaja un empleado. Algunos ejemplos de variables nominales son: región, código postal o confesión

religiosa.

vOrdinal. Una variable puede ser tratada como ordinal cuando sus valores representan categorías con

alguna clasificación intrínseca. Por ejemplo, los niveles de satisfacción con un servicio, que abarquen

desde muy insatisfecho hasta muy satisfecho. Entre los ejemplos de variables ordinales se incluyen

escalas de actitud que representan el grado de satisfacción o confianza y las puntuaciones de

evaluación de las preferencias.

vEscalas. Una variable puede tratarse como escala (continua) cuando sus valores representan categorías

ordenadas con una métrica con significado, por lo que son adecuadas las comparaciones de distancia

entre valores. Son ejemplos de variables de escala: la edad en años y los ingresos en dólares.

Nota: Para variables de cadena ordinales, se asume que el orden alfabético de los valores de cadena indica

el orden correcto de las categorías. Por ejemplo, en una variable de cadena cuyos valores sean bajo,medio,

alto, se interpreta el orden de las categorías como alto,bajo,medio (orden que no es el correcto). Por norma

general, se puede indicar que es más fiable utilizar códigos numéricos para representar datos ordinales.

Para nuevas variables numéricas creadas con transformaciones, los datos de orígenes externos y los

archivos de datos de IBM SPSS Statistics creados antes de la versión 8, el nivel de medición

predeterminado está determinado por las condiciones de la tabla siguiente. Las condiciones se evalúan en

el orden de la tabla. Se aplicará el nivel de medición de la primera condición que coincida con los datos.

Tabla 6. Reglas para determinar el nivel de medición

Condición Nivel de medición

Faltan todos los valores de una variable Nominal

El formato es dólar o una divisa personalizada Continuo

El formato es la fecha u hora (excluyendo mes y día de la semana) Continuo

La variable contiene al menos un valor no entero Continuo

La variable contiene al menos un valor negativo Continuo

La variable contiene valores no válidos inferiores a 10.000 Continuo

La variable tiene No más valores válidos, valores exclusivos* Continuo

La variable tiene valores no válidos inferiores a 10 Continuo

La variable tiene menos de Nvalores válidos, exclusivos* Nominal

Capítulo 5. Editor de datos 57

*Nes un valor de corte especificado por el usuario. El valor predeterminado es 24.

vPuede cambiar el valor de corte en el cuadro de diálogo Opciones. Consulte el tema “Datos: Opciones”

en la página 219 para obtener más información.

vEl cuadro de diálogo Definir propiedades de variables, disponible en el menú Datos, puede ayudarle a

asignar el nivel de medición correcto. Consulte el tema “Asignación del nivel de medición” en la

página 78 para obtener más información.

Tipo de variable

Tipo de variable especifica los tipos de datos de cada variable. De forma predeterminada, se asume que

todas las variables nuevas son numéricas. Se puede utilizar Tipo de variable para cambiar el tipo de

datos. El contenido del cuadro de diálogo Tipo de variable depende del tipo de datos seleccionado. Para

algunos tipos de datos, hay cuadros de texto para la anchura y el número de decimales; para otros tipos

de datos, simplemente puede seleccionar un formato de una lista desplegable de ejemplos.

Los tipos de datos disponibles son los siguientes:

Numérico. Una variable cuyos valores son números. Los valores se muestran en formato numérico

estándar. El Editor de datos acepta valores numéricos en formato estándar o en notación científica.

Coma. Una variable numérica cuyos valores se muestran con comas que delimitan cada tres posiciones y

con el punto como delimitador decimal. El Editor de datos acepta valores numéricos para este tipo de

variables con o sin comas, o bien en notación científica. Los valores no pueden contener comas a la

derecha del indicador decimal.

Punto. Una variable numérica cuyos valores se muestran con puntos que delimitan cada tres posiciones y

con la coma como delimitador decimal. El Editor de datos acepta valores numéricos para este tipo de

variables con o sin puntos, o bien en notación científica. Los valores no pueden contener puntos a la

derecha del indicador decimal.

Notación científica. Una variable numérica cuyos valores se muestran con una E intercalada y un

exponente con signo que representa una potencia de base 10. El Editor de datos acepta para estas

variables valores numéricos con o sin el exponente. El exponente puede aparecer precedido por una E o

una D con un signo opcional, o bien sólo por el signo (por ejemplo, 123, 1,23E2, 1,23D2, 1,23E+2 y

1,23+2).

Fecha. Una variable numérica cuyos valores se muestran en uno de los diferentes formatos de

fecha-calendario u hora-reloj. Seleccione un formato de la lista. Puede introducir las fechas utilizando

como delimitadores: barras inclinadas, guiones, puntos, comas o espacios. El rango de siglo para los

valores de año de dos dígitos está determinado por la configuración de las opciones (en el menú Edición,

seleccione Opciones y, a continuación, pulse en la pestaña Datos).

Dólar. Una variable numérica que se muestra con un signo dólar inicial ($), comas que delimitan cada

tres posiciones y un punto como delimitador decimal. Se pueden introducir valores de datos con o sin el

signo dólar inicial.

Moneda personalizada. Una variable numérica cuyos valores se muestran en uno de los formatos de

moneda personalizados que se hayan definido previamente en la pestaña Moneda del cuadro de diálogo

Opciones. Los caracteres definidos en la moneda personalizada no se pueden emplear en la introducción

de datos pero sí se mostrarán en el Editor de datos.

Cadena. Una variable cuyos valores no son numéricos y, por lo tanto, no se utilizan en los cálculos. Los

valores pueden contener cualquier carácter siempre que no se exceda la longitud definida. Las

mayúsculas y las minúsculas se consideran diferentes. Este tipo también se conoce como variable

alfanumérica.

58 Guía del usuario de IBM SPSS Statistics 23 Core System

Numérico restringido. Una variable cutos valores están restringidos para enteros no negativos. Los

valores aparecen con los ceros iniciales llenando el ancho máximo de la variable. Los valores se pueden

introducir en notación científica.

Para definir el tipo de variable

1. Pulse en el botón de la casilla Tipo de la variable que se quiere definir.

2. Seleccione el tipo de datos en el cuadro de diálogo Tipo de variable.

3. Pulse en Aceptar.

Formatos de entrada frente a formatos de presentación

Dependiendo del formato, la presentación de valores en la Vista de datos puede ser diferente del valor

real que se ha introducido y almacenado internamente. A continuación, se proporcionan algunas normas

generales:

vPara formatos numéricos, de coma y de punto, se pueden introducir valores con cualquier número de

dígitos decimales (hasta 16) y el valor completo se almacena internamente. La Vista de datos muestra

sólo el número definido de dígitos decimales y redondea los valores con más decimales. Sin embargo,

el valor completo se utiliza en todos los cálculos.

vPara las variables de cadena, todos los valores se rellenan por la derecha hasta el ancho máximo. Para

una variable de cadena con un ancho de tres, un valor de No se almacena internamente como ’No ’ y

no es equivalente a ’ No’.

vPara formatos de fecha, se pueden utilizar guiones, barras inclinadas, espacios, comas o puntos como

separadores entre valores de día, mes y año; se pueden introducir números, abreviaciones de tres letras

o nombres completos para el valor de mes. Las fechas del formato general dd-mmm-aa aparecen

separadas por guiones y con abreviaciones de tres letras para el mes. Las fechas del formato general

dd/mm/aa ymm/dd/aa se muestran con barras inclinadas como separadores y números para el mes.

Internamente, las fechas se almacenan como el número de segundos transcurridos desde el 14 de

octubre de 1582. El rango de siglo para años de dos dígitos está determinado por la configuración de

las opciones (en el menú Edición, seleccione Opciones y, a continuación, pulse en la pestaña Datos).

vPara formatos de hora, se pueden utilizar dos puntos, puntos o espacios como separadores entre horas,

minutos y segundos. Las horas se muestran separadas por dos puntos. Internamente, las horas se

almacenan como el número de segundos que representa un intervalo de tiempo. Por ejemplo, 10:00:00

se almacena internamente como 36000, que es 60 (segundos por minuto) x 60 (minutos por hora) x 10

(horas).

Etiquetas de variable

Puede asignar etiquetas de variable descriptivas de hasta 256 caracteres de longitud (128 caracteres en los

idiomas de doble byte). Las etiquetas de variable pueden contener espacios y caracteres reservados que

no se admiten en los nombres de variable.

Para especificar etiquetas de variable

1. Haga que el editor de datos sea la ventana activa.

2. Pulse dos veces en un nombre de variable en la parte superior de la columna en la Vista de datos o

bien pulse en la pestaña Vista de variables.

3. Escriba la etiqueta de variable descriptiva en la casilla Etiqueta de la variable.

Etiquetas de valores

Puede asignar etiquetas de valor descriptivas a cada valor de una variable. Este proceso es especialmente

útil si el archivo de datos utiliza códigos numéricos para representar categorías que no son numéricas

(por ejemplo, códigos1y2para hombre ymujer).

Para especificar etiquetas de valor

1. Pulse en el botón de la casilla Valores de la variable que se quiere definir.

2. Para cada valor, escriba el valor y una etiqueta.

Capítulo 5. Editor de datos 59

3. Pulse en Añadir para introducir la etiqueta de valor.

4. Pulse en Aceptar.

Inserción de saltos de línea en etiquetas

Las etiquetas de valor y las de variable se dividen automáticamente en varias líneas en los gráficos y en

las tablas dinámicas si el ancho de casilla o el área no es suficiente para mostrar la etiqueta entera en una

línea. Se pueden editar los resultados para insertar saltos de línea manuales si se quiere dividir la

etiqueta en un punto diferente. También puede crear etiquetas de variable y de valor que siempre se

dividan en puntos especificados y se muestren en varias líneas.

1. Para etiquetas de variable, seleccione la casilla Etiqueta de la variable en la Vista de variables del

Editor de datos.

2. Para etiquetas de valor, seleccione la casilla Valores correspondiente a la variable en la Vista de

variables del Editor de datos, pulse el botón de la casilla y, a continuación, seleccione la etiqueta que

desea modificar en el cuadro de diálogo Etiquetas de valor.

3. En el punto de la etiqueta en el que desea dividir la etiqueta, escriba \n.

El \n no aparece en las tablas dinámicas ni en los gráficos; se interpreta como un carácter de salto de

línea.

Valores perdidos

Valores perdidos define los valores de los datos definidos como perdidos del usuario. Por ejemplo, es

posible que quiera distinguir los datos perdidos porque un encuestado se niegue a responder de los datos

perdidos porque la pregunta no afecta a dicho encuestado. Los valores de datos que se especifican como

perdidos del usuario aparecen señalados para un tratamiento especial y se excluyen de la mayoría de los

cálculos.

Para definir los valores perdidos

1. Pulse en el botón de la casilla Perdido de la variable que se quiere definir.

2. Introduzca los valores o el rango de valores que representen los datos perdidos.

Papeles

Algunos cuadros de diálogo admiten papeles predefinidos que se pueden utilizar para preseleccionar

variables para el análisis. Cuando abre uno de estos cuadros de diálogo, las variables que cumplen los

requisitos de papeles se muestran automáticamente en la lista(s) de destinos. Los papeles disponibles son:

Entrada. La variable se utilizará como una entrada (por ejemplo, predictor, variable independiente).

Destino. La variable se utilizará como una salida u objetivo (por ejemplo, variable dependiente).

Ambos. La variable se utilizará como entrada y salida.

Ninguno. La variable no tiene asignación de función.

Partición. La variable se utilizará para dividir los datos en muestras diferentes para entrenamiento,

prueba y validación.

Segmentar. Se incluye para compatibilidad global con IBM SPSS Modeler. Las variables con este papel no

se utilizan como variables de segmentación de archivos en IBM SPSS Statistics.

vDe forma predeterminada, todas las variables se asignan al papel Input. Se incluyen los datos de

formatos de archivo externos y los archivos de datos creados en versiones anteriores de IBM SPSS

Statistics anteriores a la versión 18.

vLa asignación de papeles sólo afecta a los cuadros de diálogo que admiten asignaciones de papeles. No

tiene ningún efecto en la sintaxis de comandos.

60 Guía del usuario de IBM SPSS Statistics 23 Core System

Para asignar papeles

1. Seleccione el papel de la lista en la casilla Papel de la variable.

Ancho de columna

Se puede especificar un número de caracteres para el ancho de la columna. Los anchos de columna

también se pueden cambiar en la Vista de datos pulsando y arrastrando los bordes de las columnas.

vEl ancho de columna para fuentes proporcionales se basa en el ancho medio de los caracteres.

Dependiendo de los caracteres utilizados en el valor, se mostrarán más o menos caracteres con el ancho

especificado.

vEl ancho de columna afecta sólo a la presentación de valores en el Editor de datos. Al cambiar el ancho

de columna no se cambia el ancho definido de una variable.

Alineación de la variable

La alineación controla la presentación de los valores de los datos y/o de las etiquetas de valor en la Vista

de datos. La alineación predeterminada es a la derecha para las variables numéricasyalaizquierda para

las variables de cadena. Este ajuste sólo afecta a la presentación en la Vista de datos.

Aplicación de atributos de definición de variables a varias variables

Tras definir los atributos de definición de variables correspondientes a una variable, puede copiar uno o

más atributos y aplicarlos a una o más variables.

Se utilizan las operaciones básicas de copiar y pegar para aplicar atributos de definición de variables.

Puede:

vCopiar un único atributo (por ejemplo, etiquetas de valor) y pegarlo en la misma casilla de atributo

para una o más variables.

vCopiar todos los atributos de una variable y pegarlos en una o más variables.

vCrear varias variables nuevas con todos los atributos de una variable copiada.

Aplicación de atributos de definición de variables a varias variables

Para aplicar atributos individuales de una variable definida

1. En Vista de variables, seleccione la casilla de atributos que quiere aplicar a otras variables.

2. Elija en los menús:

Editar >Copiar

3. Seleccione la casilla de atributos a la que quiere aplicar el atributo. (Puede seleccionar varias variables

de destino.)

4. Elija en los menús:

Editar >Pegar

Si pega el atributo en filas vacías, se crean nuevas variables con atributos predeterminados para todos los

atributos excepto para el seleccionado.

Para aplicar todos los atributos de una variable definida

1. En Vista de variables, seleccione el número de fila para la variable con los atributos que quiere

utilizar. (Se resaltará la fila entera.)

2. Elija en los menús:

Editar >Copiar

3. Seleccione los números de fila de las variables a la que desea aplicar los atributos. (Puede seleccionar

varias variables de destino.)

4. Elija en los menús:

Capítulo 5. Editor de datos 61

Editar >Pegar

Generación de varias variables nuevas con los mismos atributos

1. En la Vista de variables, pulse en el número de fila de la variable que tiene los atributos que quiere

utilizar para la nueva variable. (Se resaltará la fila entera.)

2. Elija en los menús:

Editar >Copiar

3. Pulse en el número de la fila vacía situada bajo la última variable definida en el archivo de datos.

4. Elija en los menús:

Editar >Pegar variables...

5. En el cuadro de diálogo Pegar variables, escriba el número de variables que desea crear.

6. Introduzca un prefijo y un número inicial para las nuevas variables.

7. Pulse en Aceptar.

Los nombres de las nuevas variables se compondrán del prefijo especificado, más un número secuencial

que comienza por el número indicado.

Atributos personalizados de variables

Además de los atributos de variable estándar (como las etiquetas de valores, los valores perdidos y el

nivel de medición), puede crear sus propios atributos de variable personalizados. Al igual que los

atributos de variable estándar, estos atributos personalizados se guardan en los archivos de datos IBM

SPSS Statistics. De esta forma, puede crear un atributo de variable que identifique el tipo de respuesta

para las preguntas de encuesta (por ejemplo, selección única, selección múltiple, rellenar) o las fórmulas

empleadas para el cálculo de variables.

Creación de atributos de variable personalizados

Para crear nuevos atributos personalizados:

1. En la Vista de variables, elija en los menús:

Datos >Nuevo atributo personalizado...

2. Arrastre las variables a las que desea asignar el nuevo atributo a la lista y colóquelas en la lista

Variables seleccionadas.

3. Escriba el nombre del atributo. Los nombres de atributo deben cumplir las mismas reglas que los

nombres de variable. Consulte el tema “Nombres de variable” en la página 56 para obtener más

información.

4. Introduzca un valor opcional para el atributo. Si selecciona varias variables, el valor se asignará a

todas las variables seleccionadas. Puede dejar este campo en blanco y especificar valores para cada

variable en la Vista de variables.

Mostrar atributo en Editor de datos. Muestra el atributo en la Vista de variables del Editor de datos.

Para obtener información sobre cómo controlar la presentación de atributos personalizados consulte

“Presentación y edición de los atributos de variable personalizados” a continuación.

Mostrar lista definida de atributos. Muestra una lista de atributos personalizados ya definidos para el

conjunto de datos. Los nombres de atributo que comienzan con un signo de dólar ($) son atributos

reservados que no es posible modificar.

Presentación y edición de los atributos de variable personalizados

Puede mostrar y editar los atributos de variable personalizados en la Vista de variables del Editor de

datos.

vLos nombres de atributos de variable personalizados aparecen entre corchetes.

vLos nombres de atributo que comienzan con un signo de dólar son reservados y no se pueden

modificar.

62 Guía del usuario de IBM SPSS Statistics 23 Core System

vUna casilla en blanco indica que el atributo no existe para la variable; el texto Vacío mostrado en una

casilla indica que el atributo existe para dicha variable pero no se ha asignado ningún valor al atributo

de dicha variable. Una vez que se escribe texto en la casilla, existe el atributo para dicha variable con el

valor que ha introducido.

vSi aparece el texto Matriz..., en una casilla, indica que se trata de una matriz de atributos, un atributo

que contiene varios valores. Pulse en el botón de la casilla para mostrar la lista de valores.

Para mostrar y editar atributos de variable personalizados

1. En la Vista de variables, elija en los menús:

Ver >Personalizar vista de variables...

2. Seleccione (marque) los atributos de variable personalizados que desea mostrar. (Los atributos de

variable personalizados son los que aparecen entre corchetes.)

Una vez que los atributos aparecen en la Vista de variables, puede modificarlos directamente en el Editor

de datos.

Matrices de atributos de variable: El texto Matriz... que se muestra en una casilla para un atributo de

variable personalizado en Vista de variables o en el cuadro de diálogo Atributos personalizados de

variables en Definir propiedades de variables indica que es una matriz de atributos, un atributo que

contiene varios valores. Por ejemplo, podría tener una matriz de atributos que identificara todas las

variables origen para calcular una variable derivada. Pulse en el botón de la casilla para mostrar y editar

la lista de valores.

Personalización de la Vista de variables

Puede utilizar la opción Personalizar Vista de variables para controlar qué atributos se muestran en la

Vista de variables (por ejemplo, nombre, tipo, etiqueta) y el orden en el que aparecen.

vTodos los atributos de variable personalizados asociados al conjunto de datos aparecen entre corchetes.

Consulte el tema “Creación de atributos de variable personalizados” en la página 62 para obtener más

información.

vLos ajustes de presentación personalizados se guardan en los archivos de datos con formato IBM SPSS

Statistics.

vTambién puede controlar la presentación predeterminada y el orden de los atributos en la Vista de

variables. Consulte el tema “Cambio de la Vista de variables predeterminado” en la página 221 para

obtener más información.

Para personalizar la Vista de variables

1. En la Vista de variables, elija en los menús:

Ver >Personalizar vista de variables...

2. Seleccione (marque) los atributos de variable que desea mostrar.

3. Utilice los botones de dirección hacia arriba y hacia abajo para cambiar el orden de la presentación de

los atributos.

Restablecer valores predeterminados. Aplica los ajustes predeterminados de presentación y orden.

Revisión ortográfica

etiquetas de variable y de valor

Para revisar la ortografía de las etiquetas de los valores y las variables:

1. Seleccione la pestaña Vista de variables en la ventana del Editor de datos.

2. Pulse con el botón derecho del ratón en la columna Etiquetas oValores y elija en el menú emergente:

Ortografía

Capítulo 5. Editor de datos 63

3. En la Vista de variables, elija en los menús:

Utilidades >Ortografía

4. En el cuadro de diálogo Etiquetas de valor, pulse en Ortografía. (Con esto, la revisión ortográfica se

limitará a las etiquetas de valor de una determinada variable.)

La revisión ortográfica se limita a las etiquetas de los valores y las variables de la Vista de variables del

Editor de datos.

Valores de datos de cadena

Para revisar la ortografía de los valores de datos de cadena:

1. Seleccione la pestaña Vista de datos en el Editor de datos.

2. Si lo desea, puede seleccionar una o más variables (columnas) para su comprobación. Para seleccionar

una variable, pulse el nombre de la variable en la parte superior de la columna.

3. Elija en los menús:

Utilidades >Ortografía

vSi no hay ninguna variable seleccionada en Vista de datos, se comprobarán todas las variables de

cadena.

vSi no hay variables de cadena en el conjunto de datos o ninguna de las variables seleccionadas es una

variable de cadena, la opción Ortografía del menú Utilidades estará desactivada.

Personalización de la Vista de variables

Puede utilizar la opción Personalizar Vista de variables para controlar qué atributos se muestran en la

Vista de variables (por ejemplo, nombre, tipo, etiqueta) y el orden en el que aparecen.

vTodos los atributos de variable personalizados asociados al conjunto de datos aparecen entre corchetes.

Consulte el tema “Creación de atributos de variable personalizados” en la página 62 para obtener más

información.

vLos ajustes de presentación personalizados se guardan en los archivos de datos con formato IBM SPSS

Statistics.

vTambién puede controlar la presentación predeterminada y el orden de los atributos en la Vista de

variables. Consulte el tema “Cambio de la Vista de variables predeterminado” en la página 221 para

obtener más información.

Para personalizar la Vista de variables

1. En la Vista de variables, elija en los menús:

Ver >Personalizar vista de variables...

2. Seleccione (marque) los atributos de variable que desea mostrar.

3. Utilice los botones de dirección hacia arriba y hacia abajo para cambiar el orden de la presentación de

los atributos.

Restablecer valores predeterminados. Aplica los ajustes predeterminados de presentación y orden.

Revisión ortográfica

etiquetas de variable y de valor

Para revisar la ortografía de las etiquetas de los valores y las variables:

1. Seleccione la pestaña Vista de variables en la ventana del Editor de datos.

2. Pulse con el botón derecho del ratón en la columna Etiquetas oValores y elija en el menú emergente:

Ortografía

64 Guía del usuario de IBM SPSS Statistics 23 Core System

3. En la Vista de variables, elija en los menús:

Utilidades >Ortografía

4. En el cuadro de diálogo Etiquetas de valor, pulse en Ortografía. (Con esto, la revisión ortográfica se

limitará a las etiquetas de valor de una determinada variable.)

La revisión ortográfica se limita a las etiquetas de los valores y las variables de la Vista de variables del

Editor de datos.

Valores de datos de cadena

Para revisar la ortografía de los valores de datos de cadena:

1. Seleccione la pestaña Vista de datos en el Editor de datos.

2. Si lo desea, puede seleccionar una o más variables (columnas) para su comprobación. Para seleccionar

una variable, pulse el nombre de la variable en la parte superior de la columna.

3. Elija en los menús:

Utilidades >Ortografía

vSi no hay ninguna variable seleccionada en Vista de datos, se comprobarán todas las variables de

cadena.

vSi no hay variables de cadena en el conjunto de datos o ninguna de las variables seleccionadas es una

variable de cadena, la opción Ortografía del menú Utilidades estará desactivada.

Introducción de datos

En la Vista de datos, puede introducir datos directamente en el Editor de datos. Se puede introducir

datos en cualquier orden. Asimismo, se pueden introducir datos por caso o por variable, para áreas

seleccionadas o para casillas individuales.

vSe resaltará la casilla activa.

vEl nombre de la variable y el número de fila de la casilla activa aparecen en la esquina superior

izquierda del Editor de datos.

vCuando seleccione una casilla e introduzca un valor de datos, el valor se muestra en el editor de

casillas situado en la parte superior del Editor de datos.

vLos valores de datos no se registran hasta que se pulsa Intro o se selecciona otra casilla.

vPara introducir datos distintos de los numéricos, en primer lugar, se debe definir el tipo de variable.

Si introduce un valor en una columna vacía, el Editor de datos creará automáticamente una nueva

variable y asignará un nombre de variable.

Para introducir datos numéricos

1. Seleccione una casilla en la Vista de datos.

2. Introduzca el valor de los datos. (El valor se muestra en el editor de casillas situado en la parte

superior del Editor de datos.)

3. Para registrar el valor, pulse Intro o seleccione otra casilla.

Para introducir datos no numéricos

1. Pulse dos veces en un nombre de variable en la parte superior de la columna en la Vista de datos o

bien pulse en la pestaña Vista de variables.

2. Pulse en el botón de la casilla Tipo de la variable.

3. Seleccione el tipo de datos en el cuadro de diálogo Tipo de variable.

Capítulo 5. Editor de datos 65

4. Pulse en Aceptar.

5. Pulse dos veces en el número de fila o pulse en la pestaña Vista de datos.

6. Introduzca en la columna los datos de la variable que se va a definir.

Para utilizar etiquetas de valor en la introducción de datos

1. Si las etiquetas de valor no aparecen en la Vista de datos, elija en los menús:

Ver >Etiquetas de valor

2. Pulse la casilla en la que quiere introducir el valor.

3. Elija una etiqueta de valor en la lista desplegable.

De este modo se introducirá el valor y la etiqueta de valor se mostrará en la casilla.

Nota: este proceso sólo funciona si ha definido etiquetas de valor para la variable.

Restricciones de los valores de datos en el Editor de datos

El ancho y el tipo de variable definidos determinan el tipo de valor que se puede introducir en la casilla

en la Vista de datos.

vSi escribe un carácter no permitido por el tipo de variable definido, no se introducirá dicho carácter.

vPara variables de cadena, no se permiten los caracteres que sobrepasen el ancho definido.

vPara variables numéricas, se pueden introducir valores enteros que excedan el ancho definido, pero el

Editor de datos mostrará la notación científica o una parte del valor seguido por puntos suspensivos

(...) para indicar que el valor es más ancho que el ancho definido. Para mostrar el valor de la casilla,

cambie el ancho definido de la variable.

Nota: cambiar el ancho de la columna no afecta al ancho de la variable.

edición de datos

Con el Editor de datos es posible modificar un archivo de datos en Vista de datos de muchas maneras.

Puede:

vCambiar los valores de datos

vCortar, copiar y pegar valores de datos

vAñadir y eliminar casos

vAñadir y eliminar variables

vCambiar el orden de las variables

Para reemplazar o modificar un valor de datos

Para eliminar el valor anterior e introducir un valor nuevo

1. En la Vista de datos, pulse dos veces en la casilla. (Su valor aparecerá en el editor de casillas.)

2. Edite el valor directamente en la casilla o en el editor de casillas.

3. Pulse Intro o seleccione otra casilla para registrar el nuevo valor.

Cortar, copiar y pegar valores de datos

Puede cortar, copiar y pegar valores de casillas individuales o grupos de valores en el Editor de datos.

Puede:

vMover o copiar un único valor de casilla a otra casilla

vMover o copiar un único valor de casilla a un grupo de casillas

vMover o copiar los valores de un único caso (fila) a varios casos

vMover o copiar los valores de una única variable (columna) a varias variables

66 Guía del usuario de IBM SPSS Statistics 23 Core System

vMover o copiar un grupo de valores de casillas a otro grupo de casillas

Conversión de datos para valores pegados en el Editor de datos

Si los tipos de variable definidos de las casillas de origen y de destino no son iguales, el Editor de datos

intentará convertir el valor. Si no es posible realizar la conversión, el valor perdido del sistema se

insertará en la casilla de destino.

Conversión de numérico o fecha a cadena. Los formatos numéricos (por ejemplo, numérico, dólar, de

punto o de coma) y de fechas se convierten en cadenas si se pegan en una casilla de variable de cadena.

El valor de cadena es el valor numérico tal como se muestra en la casilla. Por ejemplo, para la variable

con formato de dólar, el signo dólar que se muestra se convierte en parte del valor de cadena. Los valores

que sobrepasan el ancho de la variable de cadena definida quedan cortados.

Conversión de cadena a numérico o fecha. Los valores de cadena que contienen caracteres admisibles

por el formato numérico o de fecha de la casilla de destino se convierten al valor numérico o de fecha

equivalente. Por ejemplo, un valor de cadena de 25/12/91 se convierte a una fecha válida si el tipo de

formato de la casilla de destino es uno de los formatos día-mes-año, pero se convierte en perdido del

sistema si el tipo de formato de la casilla de destino es uno de los formatos mes-día-año.

Conversión de fecha a numérico. Los valores de fecha y hora se convierten a un número de segundos si

la casilla de destino es uno de los formatos numéricos (por ejemplo, numérico, dólar, de punto o de

coma). Al almacenarse internamente las fechas como el número de segundos transcurridos desde el 14 de

octubre de 1582, la conversión de fechas a valores numéricos puede generar números extremadamente

grandes. Por ejemplo, la fecha 10/29/91 se convierte al valor numérico 12.908.073.600.

Conversión de numérico a fecha u hora. Los valores numéricos se convierten a fechas u horas si el valor

representa un número de segundos que puede producir una fecha u hora válidos. Para las fechas, los

valores numéricos menores que 86.400 se convierten al valor perdido del sistema.

Inserción de nuevos casos

Al introducir datos en una casilla de una fila vacía, se crea automáticamente un nuevo caso. El Editor de

datos inserta el valor perdido del sistema para el resto de las variables de dicho caso. Si hay alguna fila

vacía entre el nuevo caso y los casos existentes, las filas en blanco también se convierten en casos nuevos

con el valor perdido del sistema para todas las variables. También puede insertar nuevos casos entre

casos existentes.

Para insertar nuevos casos entre los casos existentes

1. En la Vista de datos, seleccione cualquier casilla del caso (fila) debajo de la posición donde desea

insertar el nuevo caso.

2. Elija en los menús:

Editar >Insertar casos

Se inserta una fila nueva para el caso y todas las variables reciben el valor perdido del sistema.

Inserción de nuevas variables

La introducción de datos en una columna vacía en la Vista de datos o en una fila vacía en la Vista de

variables crea de forma automática una variable nueva con un nombre de variable predeterminado (el

prefijo var y un número secuencial) y un tipo de formato de datos predeterminado (numérico). El Editor

de datos inserta el valor perdido del sistema en todos los casos de la nueva variable. Si hay columnas

vacías en la Vista de datos o filas vacías en Vista de variables entre la nueva variable y las variables

existentes, estas filas o columnas también se convierten en nuevas variables con el valor perdido del

sistema para todos los casos. También se pueden insertar variables nuevas entre las variables existentes.

Capítulo 5. Editor de datos 67

Para insertar nuevas variables entre variables existentes

1. Seleccione cualquier casilla de la variable a la derecha (Vista de datos) o debajo (Vista de variables) de

la posición donde desea insertar la nueva variable.

2. Elija en los menús:

Editar >Insertar variable

Se insertará una nueva variable con el valor perdido del sistema para todos los casos.

Para mover variables

1. Para seleccionar la variable, pulse en el nombre de variable de la Vista de datos o en el número de fila

para la variable de la Vista de variables.

2. Arrastre y suelte la variable en la nueva ubicación.

3. Si desea colocar la variable entre dos variables ya existentes: en la Vista de datos, arrastre la variable

sobre la columna de variables a la derecha del lugar donde desea colocar la variable, o en la Vista de

variables, arrastre la variable a la fila de variables debajo de donde desee colocarla.

Para cambiar el tipo de datos

Puede cambiar el tipo de datos de una variable en cualquier momento mediante el cuadro de diálogo

Tipo de variable de la Vista de variables. El Editor de datos intentará convertir los valores existentes en el

nuevo tipo. Si no se puede realizar esta conversión, se asignará el valor perdido del sistema. Las reglas

de conversión son las mismas que las del pegado de valores de datos en una variable con distinto tipo de

formato. Si el cambio del formato de los datos puede generar la pérdida de las especificaciones de valores

perdidos o de las etiquetas de valor, el Editor de datos mostrará un cuadro de alerta solicitando

confirmación para proseguir o cancelar la operación.

Búsqueda de casos, variables o imputaciones

El cuadro de diálogo Ir a busca el número (fila) del caso especificado o el nombre de la variable en el

Editor de datos.

Casos

1. Para los casos, elija en los menús:

Editar >Ir a caso...

2. Escriba un valor entero que represente el número de fila actual en la Vista de datos.

Nota: el número de fila actual de un determinado caso puede cambiar debido al orden o a otras acciones.

Variables

1. Para las variables, elija en los menús:

Editar >Ir a la variable...

2. Escriba el nombre de la variable o seleccione la variable en la lista desplegable.

Imputaciones

1. Elija en los menús:

Editar >Ir a la imputación...

2. Seleccione la imputación (o datos originales) en la lista desplegable.

También puede seleccionar la imputación en la lista desplegable de la barra de edición en Vista de datos

del Editor de datos.

68 Guía del usuario de IBM SPSS Statistics 23 Core System

La posición relativa de caso se mantiene al seleccionar imputaciones. Por ejemplo, si hay 1.000 casos en el

conjunto de datos original, el caso 1.034, el 34º caso de la primera imputación, aparece en la parte

superior de la cuadrícula. Si selecciona la imputación 2en la lista desplegable, el caso 2034, el 34º caso de

la segunda imputación, aparecerá en la parte superior de la cuadrícula. Si selecciona Datos originales en

la lista desplegable, el caso 34 aparecerá en la parte superior de la cuadrícula. La posición de columna

también se mantiene al desplazarse entre imputaciones, de modo que es fácil comparar valores entre

imputaciones.

Búsqueda y sustitución de datos y valores de atributo

Para buscar o sustituir valores de datos en la Vista de datos o valores de atributos en la Vista de

variables:

1. Pulse en una casilla de la columna en la que desea buscar. (La búsqueda y sustitución de valores se

limita a una única columna.)

2. Elija en los menús:

Editar >Buscar

Editar >Reemplazar

Vista de datos

vNo se puede buscar en la Vista de datos. La dirección de búsqueda es siempre hacia abajo.

vPara fechas y horas, se buscan los valores con formato, es decir, tal como aparecen en la Vista de datos.

Por ejemplo, si se busca la fecha 10-28-2007 no se encontrará una fecha que aparezca como 10/28/2007.

vPara las demás variables numéricas, Contiene,Comienza por yTermina por buscan valores con

formato. Por ejemplo, con la opción Comienza por, un valor de búsqueda de $123 para una variable

con formato dólar encontrará tanto 123,00 como 123,40 pero no 1.234 dólares. Con la opción Casilla

entera, el valor de búsqueda puede tener formato o no (formato numérico F simple), pero sólo se

buscarán valores numéricos exactos (con la precisión mostrada en el Editor de datos).

vEl valor numérico perdido del sistema se representa con un único punto (.) Para encontrar valores

perdidos del sistema, introduzca un único punto como valor de búsqueda y seleccione Casilla entera.

vSi se muestran las etiquetas de valor para la columna de variable seleccionada, se buscará el texto de la

etiqueta y no el valor de datos subyacente. Además, no podrá sustituir el texto de la etiqueta.

Vista de variables

vLa búsqueda sólo está disponible para Nombre,Etiqueta,Valores,Perdidos y las columnas de atributos de

variable personalizados.

vLa sustitución sólo está disponible para Etiqueta,Valores y columnas de atributos personalizados.

vEn la columna Valores (etiquetas de valor), la cadena de búsqueda puede buscar el valor de datos o una

etiqueta de valor.

Nota: la sustitución del valor de datos eliminará cualquier etiqueta de valor anteriormente asociada a

dicho valor.

Obtención de estadísticos descriptivos para variables seleccionadas

Para obtener estadísticos descriptivos para las variables seleccionadas:

1. Pulse con el botón derecho en las variables seleccionadas en Vista de datos o Vista de variables.

2. En el menú emergente seleccione Estadísticos descriptivos.

De forma predeterminada, las tablas de frecuencia (tablas de recuentos) se muestran para todas las

variables con 24 o menos valores exclusivos. Los estadísticos de resumen se determinan mediante un

nivel de medición de variable y el tipo de datos (numérico o de cadena):

vCadena. No se calculan estadísticos de resumen para variables de cadena.

Capítulo 5. Editor de datos 69

vNivel de medición numérico, nominal o desconocido. Rango, mínimo, máximo, moda.

vNivel de medición numérico, ordinal. Rango, mínimo, máximo, moda, media, mediana.

vNivel de medición numérico, continuo (escala). Rango, mínimo, máximo, moda, media, mediana,

desviación estándar.

También puede obtener gráficos de barras para variables nominales y ordinales, histogramas para

variables continuas (escala) y cambiar el valor de corte que determina cuándo mostrar tablas de

frecuencia. Consulte el tema “Opciones de resultados” en la página 222 para obtener más información.

Estado de selección de casos en el Editor de datos

Si ha seleccionado un subconjunto de casos pero no ha descartado los casos no seleccionados, éstos se

marcarán en el Editor de datos con una línea diagonal (barra inclinada) atravesando el número de fila.

Editor de datos: Opciones de presentación

El menú Ver proporciona varias opciones de presentación para el Editor de datos:

Fuentes. Esta opción controla las características de fuentes de la presentación de datos.

Líneas de cuadrícula. Esta opción activa y desactiva la presentación de las líneas de cuadrícula.

Etiquetas de valor. Esta opción activa y desactiva la presentación de los valores reales de los datos y las

etiquetas de valor descriptivas definidas por el usuario. Esta opción sólo está disponible en la Vista de

datos.

Uso de varias vistas

En la Vista de datos, puede crear varias vistas (paneles) mediante los divisores situados debajo de la

barra de desplazamiento horizontalyaladerecha de la barra de desplazamiento vertical.

También puede utilizar el menú Ventana para insertar y eliminar divisores de paneles. Para insertar

divisores:

1. En la Vista de datos, elija en los menús:

Ventana >Dividir

Los divisores se insertan sobreyalaizquierda de la casilla seleccionada.

vSi se ha seleccionado la casilla superior izquierda, los divisores se insertan para dividir la vista actual

aproximadamente por la mitad horizontal y verticalmente.

Figura 1. Casos filtrados en el Editor de datos

70 Guía del usuario de IBM SPSS Statistics 23 Core System

vSi se selecciona una casilla distinta de la casilla superior de la primera columna, se inserta un divisor

de paneles horizontales sobre la casilla seleccionada.

vSi se selecciona una casilla distinta de la primera casilla de fila superior, se inserta un divisor de

paneles verticales a la izquierda de la casilla seleccionada.

Impresión en el Editor de datos

Los archivos de datos se imprimen tal y como aparece en la pantalla.

vSe imprime la información que está en la vista actualmente mostrada. En la Vista de datos, se

imprimen los datos. En la Vista de variables, se imprime la información de definición de los datos.

vLas líneas de cuadrícula se imprimen si aparecen actualmente en la vista seleccionada.

vLas etiquetas de valor se imprimen si aparecen actualmente en la Vista de datos. En caso contrario, se

imprimirán los valores de datos reales.

Utilice el menú Ver en la ventana Editor de datos para mostrar u ocultar las líneas de cuadrícula y para

que se muestren o no los valores de los datos y las etiquetas de valor.

Para imprimir los contenidos del Editor de datos

1. Haga que el editor de datos sea la ventana activa.

2. Puse la pestaña de la vista que desea imprimir.

3. Elija en los menús:

Archivo >Imprimir...

Capítulo 5. Editor de datos 71

72 Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 6. Trabajo con varios orígenes de datos

A partir de la versión 14.0, se pueden tener varios orígenes de datos abiertos al mismo tiempo, lo que

facilita:

vCambiar de un origen de datos a otro.

vComparar el contenido de diferentes orígenes de datos.

vCopiar y pegar datos entre orígenes de datos.

vCrear varios subconjuntos de casos y/o variables para su análisis.

vFundir varios orígenes de datos con diferentes formatos de datos (por ejemplo, hojas de cálculo, bases

de datos, datos en texto) sin tener que guardar antes cada origen de datos.

Tratamiento básico de varios orígenes de datos

De forma predeterminada, cada origen de datos que se abra aparecerá en una nueva ventana del Editor

de datos. (Consulte “Opciones generales” en la página 217 para obtener información sobre cómo cambiar

el comportamiento predeterminado para mostrar sólo un conjunto de datos al mismo tiempo, en una

única ventana del Editor de datos).

vTodos los orígenes de datos que haya abierto anteriormente permanecerán abiertos y estarán

disponibles para su uso.

vAl abrir por primera vez un origen de datos, se convierte automáticamente en el conjunto de datos

activo.

vPara cambiar el conjunto de datos activo basta con pulsar en cualquier parte de la ventana del Editor

de datos del origen de datos que desee utilizar o bien seleccionar la ventana del Editor de datos

correspondiente a dicho origen de datos en el menú Ventana.

vSólo será posible analizar las variables del conjunto de datos activo.

vNo se puede cambiar el conjunto de datos activo mientras esté abierto cualquier cuadro de diálogo que

acceda a los datos (incluidos todos los cuadros de diálogo que muestran las listas de variables).

vAl menos una ventana del Editor de datos debe estar abierta durante una sesión. Al cerrar la última

ventana abierta del Editor de datos, IBM SPSS Statistics se cierra automáticamente, preguntándole

antes si desea guardar los cambios.

Trabajo con varios conjuntos de datos en la sintaxis de comandos

Si utiliza la sintaxis de comandos con los orígenes de datos abiertos (por ejemplo, GET FILE,GET DATA),

tendrá que usar el comando DATASET NAME para indicar explícitamente el nombre de cada conjunto de

datos y poder tener más de un origen de datos abierto al mismo tiempo.

Al trabajar con la sintaxis de comandos, aparece el nombre del conjunto de datos activo en la barra de

herramientas de la ventana de sintaxis. Todas las acciones siguientes pueden cambiar el conjunto de datos

activo:

vUsar el comando DATASET ACTIVATE.

vPulse en cualquier punto de la ventana Editor de datos de un conjunto de datos.

vSeleccione un nombre de conjunto de datos en la lista desplegable Activo de la barra de herramientas

de la ventana de sintaxis.

Copia y pegado de información entre conjuntos de datos

Puede copiar tanto datos como atributos de definición de variables de un conjunto de datos a otro,

básicamente de la misma manera que copia y pega información en un archivo de datos único.

vAl copiar y pegar determinadas casillas de datos en la Vista de datos se pegan únicamente los valores

de los datos, sin los atributos de definición de variables.

vSi se copia y pega una variable entera en la Vista de datos seleccionando el nombre de dicha variable

que aparece en la parte superior de la columna, se pegarán todos los datos y todos los atributos de

definición de variables correspondientes a dicha variable.

vAl copiar y pegar los atributos de definición de variables o las variables enteras en la Vista de

variables, se pegarán los atributos seleccionados (o toda la definición de la variable) pero no se pegará

ningún valor de los datos.

Cambio del nombre de los conjuntos de datos

Al abrir un origen de datos utilizando los menús y los cuadros de diálogo, se le asignará

automáticamente a cada origen de datos un nombre de conjunto de datos Conjunto_de_datosn, donde nes

un número entero secuencial, y al abrir un origen de datos utilizando la sintaxis de comandos, no se

asignará ningún nombre de conjunto de datos a menos que se especifique uno explícitamente utilizando

DATASET NAME . Para especificar nombres de conjuntos de datos más descriptivos:

1. En los menús de la ventana del Editor de datos correspondientes al conjunto de datos cuyo nombre

desea cambiar, seleccione:

Archivo >Cambiar nombre de conjunto de datos...

2. Escriba un nuevo nombre de conjunto de datos que cumpla las reglas de denominación de variables.

Consulte el tema “Nombres de variable” en la página 56 para obtener más información.

Supresión de varios conjuntos de datos

Si prefiere tener un único conjunto de datos disponible al mismo tiempo y desea suprimir la característica

de varios conjuntos de datos:

1. Elija en los menús:

Editar >Opciones...

2. Pulse en la pestaña General.

Seleccione (active) Abrir sólo un conjunto de datos cada vez.

Consulte el tema “Opciones generales” en la página 217 para obtener más información.

74 Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 7. Preparación de los datos

Cuando abra un archivo de datos o introduzca datos en el Editor de datos, podrá empezar a crear

informes, gráficos y análisis sin ningún trabajo preliminar adicional. Sin embargo, hay algunas

características de preparación adicional de los datos que pueden resultarle útiles, entre las que se

incluyen:

vAsignar propiedades de las variables que describan los datos y determinen cómo se deben tratar

ciertos valores.

vIdentificar los casos que pueden contener información duplicada y excluir dichos casos de los análisis o

eliminarlos del archivo de datos.

vCrear nuevas variables con algunas categorías distintas que representen rangos de valores de variables

que tengan un mayor número de valores posibles.

Propiedades de variables

Los datos introducidos en la Vista de datos del Editor de datos o leídos desde un formato de archivos

externo (como una hoja de cálculo de Excel o un archivo de datos de texto) carecen de ciertas

propiedades de variables que pueden resultar muy útiles, como:

vDefinición de etiquetas de valor descriptivas para códigos numéricos (por ejemplo, 0 = Hombre y1=

Mujer).

vIdentificación de códigos de valores perdidos (por ejemplo, 99 = No procede).

vAsignación del nivel de medición (nominal, ordinal o de escala).

Todas estas propiedades de variables (y otras) se pueden asignar en la Vista de variables del Editor de

datos. También hay algunas utilidades que le pueden ofrecer asistencia en este proceso:

vDefinir propiedades de variables puede ayudarle a definir etiquetas de valor descriptivas y valores

perdidos. Esto es especialmente útil para datos categóricos con códigos numéricos utilizados para

valores de categorías. Consulte el tema “Definición de propiedades de variables” para obtener más

información.

vDefinir nivel de medición para desconocido identifica las variables (campos) que no tengan un nivel

de medición definido y permite definir el nivel de medición de esas variables. Es importante para los

procedimientos en los que el nivel de medición puede afectar a los resultados o determinar qué

características estarán disponibles. Consulte el tema “Definición del nivel de medición para variables

con un nivel de medición desconocido” en la página 79 para obtener más información.

vCopiar propiedades de datos ofrece la posibilidad de utilizar un archivo de datos con IBM SPSS

Statistics como plantilla para definir las propiedades de variables y archivos en el archivo de datos

actual. Esto es particularmente útil si utiliza frecuentemente archivos de datos con un formato externo

que tenga un contenido similar, como puedan ser informes mensuales en formato Excel. Consulte el

tema “Copia de propiedades de datos” en la página 81 para obtener más información.

Definición de propiedades de variables

Definir propiedades de variables está diseñado para ayudarle en el proceso de asignar atributos a

variables, incluyendo la creación de etiquetas de valor descriptivas para variables categóricas (nominales

u ordinales). Definir propiedades de variables:

vExplora los datos reales y enumera todos valores de datos exclusivos para cada variable seleccionada.

vIdentifica valores sin etiquetas y ofrece una característica de “etiquetas automáticas”.

vPermite copiar etiquetas de valor definidas y otros atributos de otra variable en la variable seleccionada

o de la variable seleccionada a varias variables adicionales.

Nota: para utilizar Definir propiedades de variables sin explorar primero los casos, introduzca 0 para el

número de casos que se van a explorar.

Para definir propiedades de variables

1. Elija en los menús:

Datos >Definir propiedades de variables...

2. Seleccione las variables numéricas o de cadena para las que desea crear etiquetas de valor o definir o

cambiar otras propiedades de las variables, como los valores perdidos o las etiquetas de variable

descriptivas.

3. Especificar el número de casos que se van a explorar para generar la lista de valores exclusivos.

Resulta especialmente útil para los archivos de datos con mayor número de casos, para el cual una

exploración del archivo de datos completo podría tardar una gran cantidad de tiempo.

4. Especifique un límite superior para el número de valores exclusivos que se va a visualizar. Esto es

especialmente útil para evitar que se generen listas de cientos, miles o incluso millones de valores

para las variables de escala (intervalo continuo, razón).

5. Pulse en Continuar para abrir el cuadro de diálogo Definir propiedades de variables principal.

6. Seleccione una variable para la que desee crear etiquetas de valor o definir o cambiar otras

propiedades de las variables.

7. Introduzca el texto de etiqueta para los valores sin etiquetas que se visualicen en Cuadrícula etiqueta

valores.

8. Si hay valores para los que desea crear etiquetas de valor, pero no se visualizan dichos valores,

puede introducirlos en la columna Valores por debajo del último valor explorado.

9. Repita este proceso para cada variable de la lista para la que desee crear etiquetas de valor.

10. Pulse en Aceptar para aplicar las etiquetas de valor y otras propiedades de las variables.

Definición de etiquetas de valor y otras propiedades de las variables

El cuadro de diálogo principal Definir propiedades de variables proporciona la siguiente información

para las variables exploradas:

Lista de variables exploradas. Para cada variable explorada, aparecerá una marca de verificación en la

columna Sin etiqueta (S/E) indicando que la variable contiene valores sin etiquetas de valor asignadas.

Para ordenar la lista de variables para que aparezcan todas las variables con valores sin etiquetas en la

parte superior de la lista:

1. Pulse en el encabezado de columna Sin etiqueta debajo de la Lista de variables exploradas.

También puede ordenarla por nombre de variable o nivel de medición pulsando en el encabezado de

columna correspondiente debajo de la Lista de variables exploradas.

Cuadrícula etiqueta valores

vEtiqueta. Muestra las etiquetas de valor que ya se han definido. Puede añadir o cambiar las etiquetas

de esta columna.

vValor. Valores exclusivos para cada variable seleccionada. Esta lista de valores exclusivos se basa en el

número de casos explorados. Por ejemplo, si sólo ha explorado los primeros 100 casos del archivo de

datos, la lista reflejará sólo los valores exclusivos presentes en esos casos. Si el archivo de datos ya se

ha ordenado por la variable para la que desea asignar etiquetas de valor, la lista puede mostrar

muchos menos valores exclusivos de los que hay realmente presentes en los datos.

vRecuento. Número de veces que aparece cada valor en los casos explorados.

vPerdidos. Valores definidos para representar valores perdidos. Puede cambiar la designación de la

categoría de los valores perdidos pulsando en la casilla de verificación. Una marca indica que la

categoría se ha definido como categoría perdida del usuario. Si una variable ya tiene un rango de

76 Guía del usuario de IBM SPSS Statistics 23 Core System

valores perdidos del usuario (por ejemplo 90 - 99), no podrá añadir ni eliminar categorías de valores

perdidos para esa variable con Definir propiedades de variables. Puede utilizar la Vista de variables del

Editor de datos para modificar las categorías de valores perdidos para la variable con rangos de

valores perdidos. Consulte el tema “Valores perdidos” en la página 60 para obtener más información.

vCambiado. Indica que ha añadido o cambiado una etiqueta de valor.

Nota: si ha especificado 0 para el número de casos que se van a explorar en el cuadro de diálogo inicial,

la cuadrícula etiqueta valores estará en blanco al principio, a excepción de algunas etiquetas de valor ya

existentes y/o categorías de valores perdidos definidas para la variable seleccionada. Además, se

desactivará el botón Sugerir para el nivel de medición.

Nivel de medición. Las etiquetas de valor son especialmente útiles para las variables categóricas

(nominales u ordinales), y algunos procedimientos tratan a las variables categóricas y de escala de

manera diferente, por lo que a veces es importante asignar el nivel de medición correcto. Sin embargo, de

forma predeterminada, todas las nuevas variables numéricas se asignan al nivel de medición de escala.

Por tanto, puede que muchas variables que son de hecho categóricas, aparezcan inicialmente como

variables de escala.

Si no está seguro de qué nivel de medición debe asignar a una variable, pulse en Sugerir.

Papel. Algunos cuadros de diálogo permiten preseleccionar variables para su análisis en función de

papeles definidos. Consulte el tema “Papeles” en la página 60 para obtener más información.

Copiar propiedades. Puede copiar las etiquetas de valor y otras propiedades de las variables de otra

variable a la variable seleccionada en ese momento o desde la variable seleccionada en ese momento a

una o varias otras variables.

Valores sin etiquetas. Para crear automáticamente etiquetas para valores sin etiquetas, pulse en Etiquetas

automáticas.

Etiqueta de variable y formato de presentación

Puede cambiar de la etiqueta de variable descriptiva y el formato de presentación.

vNo puede cambiar el tipo fundamental de la variable (numérica o de cadena).

vPara las variables de cadena, sólo puede cambiar la etiqueta de variable, no el formato de presentación.

vPara las variables numéricas, puede cambiar el tipo numérico (como numérico, fecha, dólar o moneda

personalizada), el ancho (número máximo de dígitos, incluyendo los indicadores decimales y/o de

agrupación) y el número de posiciones decimales.

vPara el formato de fecha numérica, puede seleccionar un formato de fecha específico (como

dd-mm-aaaa, mm/dd/aa, aaaaddd)

vPara formato numérico personalizado, puede seleccionar uno de los cinco formatos de moneda

personalizados (de CCA a CCE). Consulte el tema “Opciones de moneda” en la página 222 para

obtener más información.

vAparece un asterisco en la columna Valor si el ancho especificado es inferior al ancho de los valores

explorados o los valores mostrados para etiquetas de valor definidas ya existentes o categorías de

valores perdidos.

vAparece un período (.) si los valores explorados o los valores mostrados para etiquetas de valor

definidas ya existentes o categorías de valores perdidos no son válidos para el tipo de formato de

presentación seleccionado. Por ejemplo, un valor numérico interno inferior a 86.400 no es válido para

una variable de formato de fecha.

Capítulo 7. Preparación de los datos 77

Asignación del nivel de medición

Cuando pulse en Sugerir para seleccionar un nivel de medición en el cuadro de diálogo principal Definir

propiedades de variables, la variable actual se evalúa en función de los casos explorados y las etiquetas

de valor definidas y se sugiere un nivel de medición en el cuadro de diálogo Sugerir nivel de medición

que se abre. El área Explicación ofrece una breve descripción de los criterios utilizados para proporcionar

el nivel de medición sugerido.

Nota: Los valores definidos para representar valores perdidos no se incluyen en la evaluación para el

nivel de medición. Por ejemplo, la explicación del nivel de medición sugerido puede indicar que la

sugerencia se basa, en parte, en el hecho de que la variable no contiene valores negativos, mientras que,

de hecho, puede contener valores negativos, pero dichos valores ya se han definido como valores

perdidos.

1. Pulse en Continuar para aceptar el nivel de medición sugerido o en Cancelar para mantener el

mismo.

Atributos personalizados de variables

El botón Atributos del cuadro de diálogo Definir propiedades de variables abre el cuadro de diálogo

Atributos personalizados de variables. Además de los atributos de variable estándar, como las etiquetas

de valores, los valores perdidos y el nivel de medición, puede crear sus propios atributos de variable

personalizados. Al igual que los atributos de variable estándar, estos atributos personalizados se guardan

en los archivos de datos IBM SPSS Statistics.

Nombre. Los nombres de atributo deben cumplir las mismas reglas que los nombres de variable.

Consulte el tema “Nombres de variable” en la página 56 para obtener más información.

Valor. Valor asignado al atributo de la variable seleccionada.

vLos nombres de atributo que comienzan con un signo de dólar son reservados y no se pueden

modificar. Puede ver el contenido de un atributo reservado pulsando el botón de la casilla que desee.

vSi aparece el texto Matriz..., en una casilla de valor, indica que se trata de una matriz de atributos,un

atributo que contiene varios valores. Pulse en el botón de la casilla para mostrar la lista de valores.

Copia de propiedades de variables

El cuadro de diálogo Aplicar etiquetas y nivel a aparece al pulsar en De otra variable oA otras variables

en el cuadro de diálogo principal Definir propiedades de variables. Muestra todas las variables

exploradas que coinciden con el tipo de variable actual (de cadena o numérico). Para las variables de

cadena, también debe coincidir la anchura definida.

1. Seleccione una única variable desde la que va a copiar las etiquetas de valor y otras propiedades de

las variables (excepto la etiqueta de la variable).

2. Seleccione una o más variables a las que va a copiar las etiquetas de valor y otras propiedades de las

variables.

3. Pulse en Copiar para copiar las etiquetas de valor y el nivel de medición.

vLas etiquetas de valor existentes y categorías de valores perdidos para las variables de destino no se

sustituyen.

vLas etiquetas de valor y las categorías de valores perdidos para los valores que no se han definido aún

para las variables de destino se añaden al conjunto de etiquetas de valor y categorías de valores

perdidos para las variables de destino.

vEl nivel de medición para las variables de destino siempre se sustituye.

vEl papel de la variable objetivo siempre se sustituye.

vSi la variable de origen o de destino tiene un rango definido de valores perdidos, no se copian las

definiciones de los valores perdidos.

78 Guía del usuario de IBM SPSS Statistics 23 Core System

Definición del nivel de medición para variables con un nivel de

medición desconocido

En algunos procedimientos, el nivel de medición puede afectar a los resultados o determinar qué

características hay disponibles, y no podrá acceder a los cuadros de diálogo de estos procedimientos

hasta que todas las variables tengan un nivel de medición definido. El cuadro de diálogo Definir nivel de

medición para desconocido le permite definir el nivel de medición para cualquier variable con un nivel

de medición desconocido sin realizar una lectura de los datos (que podría tardar mucho si los archivos de

datos tienen gran tamaño).

En ciertas condiciones, el nivel de medición de algunas variables numéricas (campos) o todas en un

archivo puede ser desconocido. Estas condiciones incluyen:

vLas variables numéricas de archivos de Excel 95 o posteriores, los archivos de datos de texto o los

orígenes de bases de datos anteriores a la primera lectura de los datos.

vLas nuevas variables numéricas creadas con comandos de transformación antes de la primera lectura

de datos tras la creación de esas variables.

Estas condiciones se aplican principalmente a la lectura de datos o la creación de nuevas variables

mediante sintaxis de comando. Los cuadros de diálogo de lectura de datos y creación de nuevas variables

transformadas automáticamente realizan una lectura de datos que define el nivel de medición en función

de las reglas de nivel de medición predeterminado.

Para definir el nivel de medición para variables con un nivel de medición desconocido

1. En el cuadro de diálogo de alerta que aparece para el procedimiento, pulse Asignar manualmente.

2. Elija en los menús:

Datos >Definir nivel de medición para desconocido

3. Mueva las variables (campos) desde la lista de origen a la lista de destino de nivel de medición

adecuada.

vNominal. Una variable puede ser tratada como nominal cuando sus valores representan categorías que

no obedecen a una clasificación intrínseca. Por ejemplo, el departamento de la compañía en el que

trabaja un empleado. Algunos ejemplos de variables nominales son: región, código postal o confesión

religiosa.

vOrdinal. Una variable puede ser tratada como ordinal cuando sus valores representan categorías con

alguna clasificación intrínseca. Por ejemplo, los niveles de satisfacción con un servicio, que abarquen

desde muy insatisfecho hasta muy satisfecho. Entre los ejemplos de variables ordinales se incluyen

escalas de actitud que representan el grado de satisfacción o confianza y las puntuaciones de

evaluación de las preferencias.

vContinua. Una variable puede tratarse como escala (continua) cuando sus valores representan categorías

ordenadas con una métrica con significado, por lo que son adecuadas las comparaciones de distancia

entre valores. Son ejemplos de variables de escala: la edad en años y los ingresos en dólares.

Conjuntos de respuestas múltiples

Las Tablas personalizadasy el Generador de gráficos admiten un tipo especial de "variable" al que se

denomina conjunto de respuestas múltiples. En realidad, los conjuntos de respuestas múltiples no son,

en sentido estricto, “variables”. No aparecen en el Editor de datos y los demás procedimientos no los

reconocen. Los conjuntos de respuestas múltiples utilizan variables para registrar respuestas a preguntas

donde el encuestado puede ofrecer más de una respuesta. Los conjuntos de respuestas múltiples se tratan

como variables categóricas y la mayoría de las acciones que puede realizar con las variables categóricas,

también las puede realizar con los conjuntos de respuestas múltiples.

Capítulo 7. Preparación de los datos 79

Los conjuntos de respuestas múltiples se crean a partir de múltiples variables del archivo de datos. Un

conjunto de respuestas múltiples es un constructo especial perteneciente a un archivo de datos. Se

pueden definir y guardar varios conjuntos en un archivo de datos IBM SPSS Statistics, pero no se pueden

importar o exportar conjuntos de respuestas múltiples desde o a otros formatos de archivo. (Se pueden

copiar conjuntos de respuestas múltiples de otros archivos de datos IBM SPSS Statistics mediante Copiar

propiedades de datos en el menú Datos en la ventana Editor de datos.

Para definir conjuntos de respuestas múltiples

Para definir conjuntos de respuestas múltiples:

1. Elija en los menús:

Datos >Definir conjuntos de respuestas múltiples...

2. Seleccione dos o más variables. Si las variables están codificadas como dicotomías, indique qué valor

desea contar.

3. Escriba un nombre exclusivo para cada conjunto de respuestas múltiples. El nombre puede tener una

longitud de hasta 63 bytes. Se añadirá automáticamente un signo de dólar al comienzo del nombre

del conjunto.

4. Escriba una etiqueta descriptiva para el conjunto. (Esto es opcional.)

5. Pulse Añadir para añadir el conjunto de respuestas múltiples a la lista de conjuntos definidos.

Dicotomías

Un conjunto de dicotomías múltiples consta de varias variables de dicotomía, es decir, variables con sólo

dos valores posibles del tipo sí/no, presente/ausente, seleccionado/no seleccionado. Si bien las variables

pueden no ser estrictamente dicotómicas, todas las variables del conjunto se codifican de la misma

manera, y el valor contado representa la condición correspondiente a afirmativo/presente/seleccionado.

Por ejemplo, una encuesta formula la pregunta, "¿En cuáles de las siguientes fuentes confía para obtener

noticias?" y proporciona cinco posibles respuestas. El encuestado puede señalar varias opciones marcando

un cuadro situado junto a cada opción. Las cinco respuestas se convierten en cinco variables en el archivo

de datos, con las codificaciones 0 para No (no seleccionado) y 1 para Sí (seleccionado). En el conjunto de

dicotomías múltiples, el valor contado es 1.

El archivo de datos de muestra survey_sample.sav ya contiene tres conjuntos de respuestas múltiples

definidos. $mltnews es un conjunto de dicotomías múltiples.

1. Seleccione (pulse en) $mltnews en la lista Conj. respuestas múlt..

Con ello se muestran las variables y las opciones utilizadas para definir este conjunto de respuestas

múltiples.

vLa lista Variables del conjunto, muestra las cinco variables utilizadas para construir el conjunto de

respuestas múltiples.

vEl grupo Codificación de la variable indica que las variables son dicotómicas.

vEl valor contado es 1.

2. Seleccione (pulse en) una de las variables de la lista Variables del conjunto.

3. Pulse con el botón derecho del ratón en la variable y seleccione Información sobre la variable en el

menú emergente.

4. En la ventana Información sobre la variable, pulse en la flecha de la lista desplegable Etiquetas de

valor para mostrar toda la lista de etiquetas de valor definidas.

Las etiquetas de valor indican que la variable es una dicotomía con valores de0y1,querepresentan No

ySí, respectivamente. Las cinco variables de la lista están codificadas de la misma manera y el valor de 1

(el código para Sí) es el valor contado para el conjunto de dicotomías múltiples.

Categorías

80 Guía del usuario de IBM SPSS Statistics 23 Core System

Un conjunto de categorías múltiples se compone de varias variables, todas ellas codificadas de la misma

manera, a menudo con muchas posibles categorías de respuestas. Por ejemplo, un elemento de la

encuesta pregunta, "Nombre hasta tres nacionalidades que mejor describan su herencia étnica". Puede

haber cientos de respuestas posibles, pero por cuestiones de codificación se ha limitado la lista a las 40

nacionalidades más comunes, con cualquier otra opción relegada a la categoría "otras". En el archivo de

datos, las tres opciones se convierten en tres variables, cada una con 41 categorías (40 nacionalidades

codificadas más la categoría "otras").

En el archivo de datos de muestra, $ethmult y$mltcars son conjuntos de categorías múltiples.

Origen de etiquetas de categoría

Para dicotomías múltiples, puede controlar cómo se etiquetan los conjuntos.

vEtiquetas de variable. Utiliza las etiquetas de variable definidas (o los nombres de variable para las

variables que no tienen etiquetas de variable definidas) como las etiquetas de categoría de conjunto.

Por ejemplo, si todas las variables del conjunto tienen la misma etiqueta de valor (o no tienen etiquetas

de valor definidas) para el valor contado (por ejemplo, Sí), debe utilizar las etiquetas de variable como

las etiquetas de categoría de conjunto.

vEtiquetas de valores contados. Utiliza las etiquetas de valor definidas de los valores contados como

etiquetas de categoría de conjunto. Seleccione esta opción sólo si todas las variables tienen una etiqueta

de valor definida para el valor contado y la etiqueta de valor para el valor contado es distinta para

cada variable.

vUtilizar etiqueta de variable como etiqueta de conjunto. Si selecciona Etiquetas de valores contados,

también puede utilizar la etiqueta de variable para la primera variable del conjunto con una etiqueta

de variable definida como la etiqueta de conjunto. Si ninguna de las variables del conjunto tiene

etiquetas de variable definidas, el nombre de la primera variable del conjunto se utiliza como la

etiqueta de conjunto.

Copiar propiedades de datos

Copia de propiedades de datos

El Asistente para la copia de propiedades de datos ofrece la posibilidad de utilizar un archivo de datos

de IBM SPSS Statistics externo como plantilla para definir las propiedades del archivo y las variables del

conjunto de datos activo. También puede utilizar variables del conjunto de datos activo como plantillas

para otras variables del conjunto de datos activo. Puede:

vCopiar las propiedades de archivo seleccionadas de un archivo de datos externo o de un conjunto de

datos abierto en el conjunto de datos activo. Las propiedades de archivo incluyen documentos,

etiquetas de archivos, conjuntos de respuestas múltiples, conjuntos de variables y ponderación.

vCopiar las propiedades de archivo seleccionadas de un archivo de datos externo o de un conjunto de

datos abierto en las variables coincidentes del conjunto de datos activo. Las propiedades de variable

incluyen etiquetas de valor, valores perdidos, nivel de medición, etiquetas de variable, formatos de

impresión y escritura, alineación y ancho de columna (en el Editor de datos).

vCopiar las propiedades de variable seleccionadas de una variable, ya sea del archivo de datos externo,

de un conjunto de datos abierto o del conjunto de datos activo, en diversas variables del conjunto de

datos activo.

vCrear nuevas variables en el conjunto de datos activo basándose en las variables seleccionadas del

archivo de datos externo o un conjunto de datos abierto.

Al copiar las propiedades de datos, se aplicarán las reglas siguientes:

vPara copiar un archivo de datos externo como archivo de datos de origen, deberá tratarse de un

archivo de datos con formato IBM SPSS Statistics.

Capítulo 7. Preparación de los datos 81

vPara utilizar el conjunto de datos activo como archivo de datos de origen, deberá contener al menos

una variable. No podrá utilizar un conjunto de datos activo que esté completamente en blanco como

archivo de datos de origen.

vLas propiedades no definidas (vacías) del conjunto de datos de origen no sobrescriben las propiedades

definidas en el conjunto de datos activo.

vLas propiedades de variable se copian desde la variable de origen únicamente a las variables de

destino de un tipo coincidente: de cadena (alfanuméricas) o numérico (incluidas numéricas, fecha y

moneda).

Nota: en el menú Archivo, Copiar propiedades de datos sustituirá a Aplicar diccionario de datos,

disponible anteriormente.

Para copiar propiedades de datos

1. Seleccione en los menús de la ventana Editor de datos:

Datos >Copiar propiedades de datos...

2. Seleccione el archivo de datos que contenga las propiedades de archivo y/o variable que desee copiar.

Puede ser un conjunto de datos abierto actualmente, un archivo de datos con formato IBM SPSS

Statistics externo o el conjunto de datos activo.

3. Siga las instrucciones detalladas del Asistente para la copia de propiedades de datos.

Selección de las variables de origen y de destino

En este paso, puede especificar tanto las variables de origen que contienen las propiedades de variable

que desea copiar como las variables de destino en las que se copiarán estas propiedades de variable.

Aplicar propiedades de variables del conjunto de datos de origen seleccionadas a variables

coincidentes del conjunto de datos activo. Las propiedades de variable se copian desde una o más

variables de origen seleccionadas en las variables coincidentes del conjunto de datos activo. Las variables

"coinciden" si el nombre y el tipo de variable (de cadena o numérico) son los mismos. En el caso de las

variables de cadena, la longitud también debe ser la misma. De forma predeterminada, sólo se muestran

en las dos listas de variables las variables coincidentes.

vCrear variables coincidentes en el conjunto de datos activo si aún no existen. Actualiza la lista de

origen para que muestre todas las variables del archivo de datos de origen. Si se seleccionan variables

de origen que no existen en el conjunto de datos activo (basándose en el nombre de variable), se

crearán nuevas variables en el conjunto de datos activo con los nombres y las propiedades de variable

del archivo de datos de origen.

Si el conjunto de datos activo no contiene variables (un nuevo conjunto de datos en blanco), se mostrarán

todas las variables del archivo de datos de origen y se crearán automáticamente en el conjunto de datos

activo nuevas variables basadas en las variables de origen seleccionadas.

Aplicar propiedades de una única variable de origen a las variables seleccionadas en el conjunto de

datos activo del mismo tipo. Las propiedades de variable de una única variable seleccionada en la lista

de origen se pueden aplicar a una o más variables seleccionadas de la lista del conjunto de datos activo.

En esta lista sólo se mostrarán las variables que sean del mismo tipo (numérico o de cadena) que la

variable seleccionada en la lista de origen. Si se trata de variables de cadena, sólo se mostrarán las

cadenas con la misma longitud definida que la variable de origen. Esta opción no está disponible si el

conjunto de datos activo no contiene variables.

Nota: no se pueden crear nuevas variables en el conjunto de datos activo con esta opción.

Aplicar sólo propiedades de conjunto de datos (sin selección de variables). Sólo se pueden aplicar al

conjunto de datos activo las propiedades de archivo (por ejemplo, documentos, etiquetas de archivo,

grosor). No se podrá aplicar ninguna propiedad de variable. Esta opción no está disponible si el conjunto

de datos activo es también el archivo de datos de origen.

82 Guía del usuario de IBM SPSS Statistics 23 Core System

Selección de propiedades de variable para copiar

Desde las variables de origen, las propiedades de variable seleccionadas no se pueden copiar en las

variables de destino. Las propiedades no definidas (vacías) de las variables de origen no sobrescriben las

propiedades definidas en las variables de destino.

Etiquetas de valor. Las etiquetas de valor son etiquetas descriptivas asociadas a valores de datos. Se

suelen utilizar cuando se seleccionan valores de datos numéricos para representar categorías no

numéricas (por ejemplo, códigos1y2para Hombre yMujer). Puede reemplazar o fundir las etiquetas de

valor en las variables de destino.

vReemplazar elimina todas las etiquetas de valor definidas para la variable objetivo y las reemplaza

por las etiquetas de valor definidas en la variable de origen.

vFundir funde las etiquetas de valor definidas en la variable de origen con cualquier etiqueta de valor

definida existente en la variable objetivo. Si existe una etiqueta de valor definida con el mismo valor

tanto en la variable de origen como en la de destino, la etiqueta de valor de la variable objetivo

permanecerá inalterada.

Atributos personalizados. Atributos de variable personalizados definidos por el usuario. Consulte el

tema “Atributos personalizados de variables” en la página 62 para obtener más información.

vReemplazar elimina todos los atributos personalizados para la variable objetivo y los reemplaza por

los atributos definidos en la variable de origen.

vFundir funde los atributos definidos de la variable de origen con cualquier atributo definido existente

en la variable objetivo.

Valores perdidos. Los valores perdidos son valores identificados como representantes de datos perdidos

(por ejemplo, 98 para No se conoce y 99 para No procede). Por lo general, estos valores tienen también

etiquetas de valor definidas que describen el significado de códigos de valores perdidos. Todos los

valores perdidos existentes definidos para la variable objetivo se eliminarán y se reemplazarán por los

valores perdidos de la variable de origen.

Etiqueta de variable. Las etiquetas de variable descriptivas pueden contener espacios y caracteres

reservados que no se permiten en los nombres de las variables. Si desea utilizar esta opción para copiar

propiedades de variable desde una variable de origen en varias variables de destino, reflexione antes de

hacerlo.

Nivel de medición. El nivel de medición puede ser nominal, ordinal o de escala.

Papel. Algunos cuadros de diálogo permiten preseleccionar variables para su análisis en función de

papeles definidos. Consulte el tema “Papeles” en la página 60 para obtener más información.

Formatos. Controla el tipo numérico (como numérico, fecha o moneda), el ancho (número total de

caracteres que se muestran, incluidos los caracteres iniciales y finales y el indicador decimal) y el número

de decimales que se van a mostrar para las variables numéricas. Esta opción no se tendrá en cuenta para

las variables de cadena.

Alineación. Afecta únicamente a la alineación (izquierda, derecha, central) del Editor de datos de la Vista

de datos.

Ancho de columna del Editor de datos. Afecta únicamente al ancho de columna de la Vista de datos del

Editor de datos.

Copia de propiedades (de archivo) de conjunto de datos

Las propiedades de conjunto de datos globales seleccionadas del archivo de datos de origen se pueden

aplicar al conjunto de datos activo. (Esta opción no está disponible si el conjunto de datos activo es el

archivo de datos de origen.)

Capítulo 7. Preparación de los datos 83

Conjuntos resp. múltiples. Aplica definiciones del conjunto de respuestas múltiples del archivo de datos

de origen al conjunto de datos activo.

vSe ignorarán los conjuntos de respuestas múltiples que contengan variables no existentes en el conjunto

de datos activo a menos que se creen estas variables basándose en las especificaciones del paso 2

(Selección de las variables de origen y de destino) del Asistente para la copia de propiedades de datos.

vReemplazar elimina todos los conjuntos de respuestas múltiples del conjunto de datos activo y los

reemplaza por los incluidos en el archivo de datos de origen.

vFundir añade los conjuntos de respuestas múltiples del archivo de datos de origen a la colección de

este tipo de conjuntos incluida en el conjunto de datos activo. En caso de que exista un conjunto con el

mismo nombre en ambos archivos, el conjunto existente del conjunto de datos activo permanecerá

inalterado.

Conjuntos de variables. Los conjuntos de variables se utilizan para controlar la lista de variables que se

muestra en los cuadros de diálogo. Para definir conjuntos de variables, seleccione Definir conjuntos de

variables en el menú Utilidades.

vSe ignorarán los conjuntos del archivo de datos de origen que contengan variables no existentes en el

conjunto de datos activo, a menos que se creen estas variables basándose en las especificaciones del

paso 2 (Selección de las variables de origen y de destino) del Asistente para la copia de propiedades de

datos.

vReemplazar elimina todos los conjuntos de variables existentes en el conjunto de datos activo y los

reemplaza por los incluidos en el archivo de datos de origen.

vFundir añade los conjuntos de variables del archivo de datos de origen a la colección de este tipo de

conjuntos incluida en el conjunto de datos activo. En caso de que exista un conjunto con el mismo

nombre en ambos archivos, el conjunto existente del conjunto de datos activo permanecerá inalterado.

Documentos. Notas añadidas al archivo de datos a través del comando DOCUMENT.

vReemplazar elimina todos los documentos existentes en el conjunto de datos activo y los reemplaza

por los incluidos en el archivo de datos de origen.

vFundir combina los documentos incluidos en los conjuntos de datos de origen y de trabajo. Los

documentos exclusivos del archivo de origen que no existan en el conjunto de datos activo se añadirán

al conjunto de datos activo. A continuación, todos los documentos se ordenarán por fecha.

Atributos personalizados. Atributos del archivo de datos personalizados, creados normalmente por el

comando DATAFILE ATTRIBUTE en la sintaxis de comandos.

vReemplazar elimina todos los atributos del archivo de datos personalizados existentes en el conjunto

de datos activo y los reemplaza por los incluidos en el archivo de datos de origen.

vFundir combina los del archivo de datos de los conjuntos de datos de origen y activo. Los nombres de

atributos exclusivos del archivo de origen que no existan en el conjunto de datos activo se añadirán al

conjunto de datos activo. En caso de que exista un atributo con el mismo nombre en ambos archivos

de datos, el atributo con nombre existente en el conjunto de datos activo permanecerá inalterado.

Especificación de ponderación. Pondera los casos por la variable de ponderación actual del archivo de

datos de origen, siempre que exista una variable coincidente en el conjunto de datos activo. Sobrescribe

cualquier ponderación activada actualmente en el conjunto de datos activo.

Etiqueta de archivo. Etiqueta descriptiva que se aplica a un archivo de datos mediante el comando FILE

LABEL.

Resultados

El último paso del Asistente para la copia de propiedades de datos proporciona información sobre el

número de variables para las que se van a copiar las propiedades de variable del archivo de datos de

origen, el número de nuevas variables que se van a crear y el número de propiedades (de archivo) de

conjunto de datos que se van a copiar.

84 Guía del usuario de IBM SPSS Statistics 23 Core System

También puede pegar la sintaxis de comandos generada en una ventana de sintaxis y guardarla para su

posterior uso.

Identificación de casos duplicados

Puede haber distintos motivos por los que haya casos "duplicados" en los datos, entre ellos:

vErrores en la entrada de datos si por accidente se introduce el mismo caso más de una vez.

vCasos múltiples que comparten un valor de identificador primario común pero tienen valores

diferentes de un identificador secundario, como los miembros de una familia que viven en el mismo

domicilio.

vCasos múltiples que representan el mismo caso pero con valores diferentes para variables que no sean

las que identifican el caso, como en el caso de varias compras realizadas por la misma persona o

empresa de diferentes productos o en diferentes momentos.

La identificación de los casos duplicados le permite definir prácticamente como quiera lo que se

considera duplicado y le proporciona cierto control sobre la determinación automática de los casos

primarios frente a los duplicados.

Para identificar y señalar los casos duplicados

1. Elija en los menús:

Datos >Identificar casos duplicados...

2. Seleccione una o varias variables que identifiquen los casos coincidentes.

3. Seleccione una o varias de las opciones del grupo Crear variables.

Si lo desea, puede:

4. Seleccionar una o varias variables para ordenar los casos dentro de los bloques definidos por las

variables seleccionadas de casos coincidentes. El orden definido por estas variables determina el

"primer" y el "último" caso de cada bloque. En caso contrario, se utilizará el orden del archivo

original.

5. Filtrar automáticamente los casos duplicados de manera que no se incluyan en los informes, los

gráficos o los cálculos de estadísticos.

Definir casos coincidentes por. Los casos se consideran duplicados si sus valores coinciden para todas las

variables seleccionadas. Si desea identificar únicamente aquellos casos que coincidan al 100% en todos los

aspectos, seleccione todas las variables.

Ordenar dentro de los bloques coincidentes por. Los casos se ordenan automáticamente por las variables

que definen los casos coincidentes. Puede seleccionar otras variables de ordenación que determinarán el

orden secuencial de los casos en cada bloque de coincidencia.

vPara cada variable de ordenación, el orden puede ser ascendente o descendente.

vSi selecciona más de una variable de ordenación, los casos se ordenarán por cada variable dentro de las

categorías de la variable anterior de la lista. Por ejemplo, si selecciona fecha como la primera variable

de ordenación y cantidad como la segunda, los casos se ordenarán por cantidad dentro de cada fecha.

vUtilice los botones de flecha hacia arriba y hacia abajo que hay a la derecha de la lista para cambiar el

orden de las variables.

vEl orden determina el "primer" y el "último" caso de cada bloque de coincidencia, que determina el

valor de la variable indicador del caso primario opcional. Por ejemplo, si desea descartar todos los

casos salvo el más reciente de cada bloque de coincidencia, puede ordenar los casos del bloque en

orden ascendente por una variable de fecha, lo cual haría que la fecha más reciente fuese la última

fecha del bloque.

Capítulo 7. Preparación de los datos 85

Variable indicador de casos primarios. Crea una variable con un valor de 1 para todos los casos

exclusivos y para el caso identificado como caso primario en cada bloque de casos coincidentes y un

valor de 0 para los duplicados no primarios de cada bloque.

vEl caso primario puede ser el primer o el último caso de cada bloque de coincidencia, según determine

el orden del bloque de coincidencia. Si no especifica ninguna variable de ordenación, el orden del

archivo original determina el orden de los casos dentro de cada bloque.

vPuede utilizar la variable indicador como una variable de filtro para excluir los duplicados que no

sean primarios de los informes y los análisis sin eliminar dichos casos del archivo de datos.

Recuento secuencial de casos coincidentes en cada bloque. Crea una variable con un valor secuencial de

1anpara los casos de cada bloque de coincidencia. La secuencia se basa en el orden actual de los casos

de cada bloque, que puede ser el orden del archivo original o el orden determinado por las variables de

ordenación especificadas.

Mover los casos coincidentes a la parte superior del archivo. Ordena el archivo de datos de manera que

todos los bloques de casos coincidentes estén en la parte superior del archivo de datos, facilitando la

inspección visual de los casos coincidentes en el Editor de datos.

Mostrar tabla de frecuencias de las variables creadas. Las tablas de frecuencias contienen los recuentos

de cada valor de las variables creadas. Por ejemplo, para la variable de indicador de caso primario, la

tabla mostraría tanto el número de casos con un valor de 0 en esa variable, que indica el número de

duplicados, como el número de casos con un valor de 1 para esa variable, que indica el número de casos

exclusivos y primarios.

Valores perdidos. En el caso de variables numéricas, los valores perdidos del sistema se tratan como

cualquier otro valor: los casos que tengan el valor perdido del sistema para una variable de identificación

se tratarán como si tuviesen valores coincidentes para dicha variable. En el caso de variables de cadena,

los casos que no tengan ningún valor para una variable de identificación se tratarán como si tuviesen

valores coincidentes para dicha variable.

Agrupación visual

La agrupación visual está concebida para ayudarle en el proceso de creación de nuevas variables basadas

en la agrupación de los valores contiguos de las variables existentes para dar lugar a un número limitado

de categorías diferentes. Puede utilizar la agrupación visual para:

vCrear variables categóricas a partir de variables de escala continuas. Por ejemplo, puede utilizar una

variable de escala con los ingresos para crear una variable categórica nueva que contenga intervalos de

ingresos.

vColapsar un número elevado de categorías ordinales en un conjunto menor de categorías. Por ejemplo,

es posible colapsar una escala de evaluación de nueve categorías en tres categorías que representen:

bajo, medio y alto.

En el primer paso, puede:

1. Seleccione las variables numéricas de escala u ordinales para las que desee crear nuevas variables

categóricas (en agrupaciones).

Como alternativa, puede limitar la cantidad de casos que se van a explorar. Con los archivos de datos

que contengan un elevado número de casos, la limitación del número de casos que se va a explorar

puede ahorrar tiempo, pero debe evitarse este procedimiento en lo posible, ya que afectará a la

distribución de los valores que se utilizarán en los cálculos posteriores en la agrupación visual.

Nota: Las variables de cadena y las variables numéricas nominales no se muestran en la lista de variables

origen. La agrupación visual requiere que las variables sean numéricas, medidas bien a nivel ordinal o de

escala, puesto que supone que los valores de los datos representan algún tipo de orden lógico que se

86 Guía del usuario de IBM SPSS Statistics 23 Core System

puede utilizar para agrupar los valores con sentido. Puede cambiar el nivel de medición de una variable

en la Vista de variables del Editor de datos. Consulte el tema “Nivel de medición de variable” en la

página 57 para obtener más información.

Para agrupar variables

1. Seleccione en los menús de la ventana Editor de datos:

Transformar >Agrupación visual...

2. Seleccione las variables numéricas de escala u ordinales para las que desee crear nuevas variables

categóricas (en agrupaciones).

3. Seleccione una variable de la Lista de variables exploradas.

4. Escriba el nombre de la nueva variable agrupada. Los nombres de variable deben ser exclusivos, y

deben seguir las normas de denominación de variables. Consulte el tema “Nombres de variable” en la

página 56 para obtener más información.

5. Defina los criterios de agrupación para la nueva variable. Consulte el tema “Agrupación de variables”

para obtener más información.

6. Pulse en Aceptar.

Agrupación de variables

El cuadro de diálogo principal de la agrupación visual proporciona la siguiente información sobre las

variables exploradas:

Lista de variables exploradas. Muestra las variables que fueron seleccionadas en el cuadro de diálogo

inicial. Puede ordenar la lista por el nivel de medición (de escala u ordinal) o por la etiqueta o el nombre

de variable, pulsando en los encabezados de las columnas.

Casos explorados. Indica el número de casos explorados. Todos los casos explorados sin valores perdidos

del usuario o del sistema para la variable seleccionada, se usan en la generación de la distribución de

valores que se emplea en los cálculos de la agrupación visual, incluyendo el histograma que se visualiza

en el cuadro de diálogo principal y los puntos de corte basados en percentiles o unidades de desviación

estándar.

Valores perdidos. Indica el número de casos explorados con valores perdidos del usuario o valores

perdidos del sistema. Los valores perdidos no se incluyen en ninguno de las categorías agrupadas.

Consulte el tema “Valores perdidos del usuario en la agrupación visual” en la página 90 para obtener

más información.

Variable actual. El nombre y etiqueta de variable (si existe) de la variable actualmente seleccionada y que

se usará como base para la nueva variable agrupada.

Variable agrupada. Nombre y etiqueta de variable alternativa para la nueva variable agrupada.

vNombre. Debe introducir un nombre para la nueva variable. Los nombres de variable deben ser

exclusivos, y deben seguir las normas de denominación de variables. Consulte el tema “Nombres de

variable” en la página 56 para obtener más información.

vEtiqueta. Puede especificar una etiqueta de variable descriptiva de hasta 255 caracteres de longitud. La

etiqueta de variable predeterminada es la etiqueta de variable (si la hubiera) o el nombre de variable

de la variable de origen con (agrupado) añadido al final de la etiqueta.

Mínimo y Máximo. Valores mínimo y máximo para la variable seleccionada actualmente, basados en los

casos explorados y excluyendo los valores perdidos del usuario.

Valores no perdidos. El histograma muestra la distribución de valores no perdidos correspondiente a la

variable seleccionada actualmente, basándose en los casos explorados.

Capítulo 7. Preparación de los datos 87

vDespués de haber definido los intervalos para la nueva variable, se mostrarán líneas verticales en el

histograma para indicar los puntos de corte que definen los intervalos.

vPuede pulsar y arrastrar las líneas de los puntos de corte a distintos puntos del histograma,

modificando así la amplitud de los intervalos.

vPuede eliminar intervalos arrastrando las líneas de los puntos de corte fuera del histograma.

Nota: el histograma (que muestra valores no perdidos), el mínimo y el máximo se basan en los casos

explorados. Si no incluye todos los casos en la exploración, es posible que no se refleje con precisión la

distribución real, sobre todo si el archivo de datos se ordenó según la variable seleccionada. Si no explora

ningún caso, no encontrará disponible información sobre la distribución de valores.

Cuadrícula. Muestra los valores que definen los puntos de corte superiores de cada intervalo, así como

las etiquetas de valor opcionales para cada intervalo.

vValor. Valores que definen los puntos de corte superiores en cada intervalo. Puede introducir los

valores o utilizar Crear puntos de corte para crear automáticamente los intervalos basándose en los

criterios seleccionados. De forma predeterminada, se incluye automáticamente un punto de corte con el

valor SUPERIOR. Este intervalo contendrá cualesquiera valores no perdidos por encima de los

restantes puntos de corte. El intervalo definido por el punto de corte inferior incluirá todos los valores

no perdidos que sean menores o iguales que dicho valor (o, sencillamente, inferiores a ese valor,

dependiendo de la forma en que haya definido los puntos de corte superiores).

vEtiqueta. Etiquetas opcionales y descriptivas de los valores de la nueva variable agrupada. Puesto que

los valores de la nueva variable sólo serán números enteros en secuencia, del 1 a n, las etiquetas que

describan lo que representan los valores pueden resultar muy útiles. Puede introducir las etiquetas o

usar Crear etiquetas para crear las etiquetas de valor de forma automática.

Para eliminar un intervalo de la cuadrícula

1. Pulse con el botón derecho en las casillas Valor oEtiqueta del intervalo.

2. En el menú emergente, seleccione Eliminar fila.

Nota: si elimina el intervalo SUPERIOR, los casos con valores superiores al valor del último punto de

corte especificado recibirán el valor perdido del sistema en la nueva variable.

Para eliminar todas las etiquetas o todos los intervalos definidos

1. Pulse en cualquier parte de la cuadrícula con el botón derecho del ratón.

2. En el menú emergente, seleccione Eliminar todas las etiquetas oEliminar todos los puntos de corte.

Límites superiores. Controla el tratamiento de los valores de los límites superiores introducidos en la

columna Valor de la cuadrícula.

vIncluidos (<=). Los casos con el valor especificado en la casilla Valor se incluyen en la categoría

agrupada. Por ejemplo, si especifica los valores 25, 50 y 75, los casos con el valor exacto 25 se incluirán

en el primer intervalo, ya que se incluirán todos los casos con valor menor o igual que 25.

vExcluido (<). Los casos con el valor especificado en la casilla Valor no se incluyen en la categoría

agrupada. Por el contrario, se incluyen en el siguiente intervalo. Por ejemplo, si especifica los valores

25, 50 y 75, los casos con el valor exacto 25 se incluirán en el segundo intervalo en vez de en el

primero, puesto que el primero sólo contendrá casos con valores inferiores a 25.

Crear puntos de corte. Genera categorías agrupadas automáticamente para crear intervalos de igual

amplitud, intervalos con el mismo número de casos o intervalos basados en un número de desviaciones

estándar. Esta posibilidad no está disponible si no se ha explorado ningún caso. Consulte el tema

“Generación automática de categorías agrupadas” en la página 89 para obtener más información.

88 Guía del usuario de IBM SPSS Statistics 23 Core System

Crear etiquetas. Genera etiquetas descriptivas para los valores enteros consecutivos contenidos en la

nueva variable agrupada, en función de los valores de la cuadrícula y el tratamiento especificado para los

límites superiores (incluidos o excluidos).

Invertir la escala. De forma predeterminada, los valores de la nueva variable agrupada serán números

enteros consecutivos, de 1 a n. La inversión de la escala convierte los valores en números enteros

consecutivos, de na1.

Copiar intervalos. Puede copiar las especificaciones de agrupación de otra variable a la variable

seleccionada en ese momento, o desde la variable seleccionada en ese momento a otras varias variables.

Consulte el tema “Copia de categorías agrupadas” en la página 90 para obtener más información.

Generación automática de categorías agrupadas

El cuadro de diálogo Crear puntos de corte permite la creación automática de categorías agrupadas en

función de los criterios seleccionados.

Para utilizar el cuadro de diálogo Crear puntos de corte

1. Seleccione (pulse) una variable de la Lista de variables exploradas.

2. Pulse Crear puntos de corte.

3. Seleccione los criterios de generación de los puntos de corte que definirán las categorías agrupadas.

4. Pulse en Aplicar.

Nota: el cuadro de diálogo Crear puntos de corte no está disponible si no se ha explorado ningún caso.

Intervalos de igual amplitud. Genera categorías agrupadas de igual amplitud (por ejemplo, 1–10, 11–20,

21–30), basándose en dos (cualesquiera) de los tres criterios siguientes:

vPosición del primer punto de corte. Valor que define el límite superior de la categoría agrupada

inferior (por ejemplo, el valor 10 indica un intervalo que incluya todos los valores hasta 10).

vNúmero de puntos de corte. El número de categorías agrupadas es el número de puntos de corte más

uno. Por ejemplo, 9 puntos de corte generan 10 categorías agrupadas.

vAmplitud. La amplitud de cada intervalo. Por ejemplo, el valor 10 agrupará la variable Edad en años

en intervalos de 10 años.

Percentiles iguales basados en los casos explorados. Genera categorías agrupadas con un número igual

de casos en cada intervalo (utilizando el algoritmo "aempirical" para el cálculo de percentiles), según uno

de los criterios siguientes:

vNúmero de puntos de corte. El número de categorías agrupadas es el número de puntos de corte más

uno. Por ejemplo, tres puntos de corte generan cuatro intervalos percentiles (cuartiles), conteniendo

cada uno el 25% de los casos.

v% de casos. Amplitud de cada intervalo, expresado en forma de porcentaje sobre el número total de

casos. Por ejemplo, el valor 33,3 generaría tres categorías agrupadas (dos puntos de corte), conteniendo

cada una el 33,3% de los casos.

Si la variable origen contiene un número relativamente pequeño de valores distintos o un gran número

de casos con el mismo valor, es posible que obtenga menos intervalos que las solicitadas. En caso de

haber varios valores idénticos en un punto de corte, todos se incluyen en el mismo intervalo; por

consiguiente, los porcentajes reales pueden no ser siempre iguales.

Puntos de corte en media y desviaciones estándar seleccionadas, basadas en casos explorados. Genera

categorías agrupadas basándose en los valores de la media y la desviación estándar de la distribución de

la variable.

vSi no selecciona ninguno de los intervalos de desviación estándar, se crearán dos categorías agrupadas,

siendo la media el punto de corte que divida los intervalos.

Capítulo 7. Preparación de los datos 89

vPuede seleccionar cualquier combinación de los intervalos de desviación estándar, basándose en una,

dos o tres desviaciones estándar. Por ejemplo, al seleccionar las tres opciones se obtendrán ocho

categorías agrupadas: seis intervalos distanciados en una desviación estándar de amplitud y dos

intervalos para los casos que se encuentren a más de tres desviaciones estándar por encima y por

debajo de la media.

En una distribución normal, el 68% de los casos se encuentra dentro de una distancia de una desviación

estándar respecto a la media, el 95% entre dos desviaciones estándar y el 99% dentro de tres desviaciones

estándar. La creación de categorías agrupadas basadas en desviaciones estándar puede ocasionar que

algunos intervalos queden definidos fuera del rango real de los datos, e incluso fuera del rango de

valores posibles de los datos (por ejemplo, un rango de salarios negativos).

Nota: los cálculos de los percentiles y las desviaciones estándar se basan en los casos explorados. Si limita

el número de casos explorados, puede que los intervalos resultantes no incluyan la proporción de casos

deseada en dichos intervalos, sobre todo si el archivo de datos se ordenó según la variable origen. Por

ejemplo, si limita la exploración a los primeros 100 casos de un archivo de datos con 1000 casos y el

archivo de datos está ordenado en orden descendente por edad del encuestado, en lugar de cuatro

intervalos percentiles de la edad, cada uno con el 25% de los casos, podría encontrarse con que los tres

primeros intervalos contuvieran cada una sólo en torno al 3,3% de los casos, mientras que el último

intervalo albergaría el 90% de los casos.

Copia de categorías agrupadas

Al crear categorías agrupadas para una o más variables, puede copiar las especificaciones de agrupación

de otra variable a la seleccionada en ese momento o desde la variable seleccionada en ese momento a

varias otras variables.

Para copiar especificaciones de intervalos

1. Defina las categorías agrupadas para una variable como mínimo; pero no pulse en Aceptar ni en

Pegar.

2. Seleccione (pulse) una variable de la Lista de variables exploradas para la cual haya definido

categorías agrupadas.

3. Pulse A otras variables.

4. Seleccione las variables para las que desea crear nuevas variables con las mismas categorías

agrupadas.

5. Pulse Copiar.

6. Seleccione (pulse) una variable de la Lista de variables exploradas sobre la cual desea copiar

categorías agrupadas ya definidas.

7. Pulse De otra variable.

8. Seleccione la variable que contiene las categorías agrupadas definidas que desea copiar.

9. Pulse Copiar.

También se copiarán las etiquetas de valor si se especificaron en la variable cuyas especificaciones de

agrupación se van a copiar.

Nota: una vez que haya pulsado en Aceptar en el cuadro de diálogo principal de la agrupación visual,

para crear nuevas variables agrupadas (o cerrado el cuadro de diálogo de alguna otra forma), no podrá

usar de nuevo la agrupación visual para copiar dichas categorías agrupadas en otras variables.

Valores perdidos del usuario en la agrupación visual

Los valores perdidos del usuario (valores identificados como los códigos para los datos perdidos) para la

variable origen no se incluyen en las categorías agrupadas de la nueva variable. Los valores perdidos del

90 Guía del usuario de IBM SPSS Statistics 23 Core System

usuario de las variables se copian como valores perdidos del usuario en la nueva variable, copiándose

también cualquier otra etiqueta de valor definida para los códigos de los valores perdidos.

Si un código de valor perdido entra en conflicto con alguno de los valores de categorías agrupadas de la

nueva variable, el código de valor perdido de la nueva variable se recodificará a un valor no conflictivo,

sumando 100 al valor de categoría agrupada superior. Por ejemplo, si el usuario define el valor 1 como

valor perdido para la variable origen y la nueva variable va a contar con seis categorías agrupadas,

cualquier caso con el valor 1 en la variable origen tendrá el valor 106 en la nueva variable, y 106 será

definido como un valor perdido del usuario. Si el valor perdido del usuario en la variable de origen tenía

definida una etiqueta de valor, dicha etiqueta se mantendrá como etiqueta de valor para el valor

recodificado de la nueva variable.

Nota: si la variable de origen tiene definido un rango de valores perdidos de usuario con la forma

MENOR-n, donde nes un número positivo, los valores perdidos del usuario correspondientes a la nueva

variable, serán números negativos.

Capítulo 7. Preparación de los datos 91

92 Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 8. Transformaciones de los datos

Transformaciones de los datos

En una situación ideal, los datos en bruto son perfectamente apropiados para el tipo de análisis que se

desea realizar y cualquier relación existente entre las variables o es adecuadamente lineal o es claramente

ortogonal. Desafortunadamente, esto ocurre pocas veces. El análisis preliminar puede revelar esquemas

de codificación poco prácticos o errores de codificación, o bien pueden requerirse transformaciones de los

datos para exponer la verdadera relación existente entre las variables.

Puede realizar transformaciones de los datos de todo tipo, desde tareas sencillas, como la agrupación de

categorías para su análisis posterior, hasta otras más avanzadas, como la creación de nuevas variables

basadas en ecuaciones complejas y sentencias condicionales.

Cálculo de variables

Utilice el cuadro de diálogo Calcular para calcular los valores de una variable basándose en

transformaciones numéricas de otras variables.

vPuede calcular valores para las variables numéricas o de cadena (alfanuméricas).

vPuede crear nuevas variables o bien reemplazar los valores de las variables existentes. Para las nuevas

variables, también se puede especificar el tipo y la etiqueta de variable.

vPuede calcular valores de forma selectiva para subconjuntos de datos basándose en condiciones lógicas.

vPuede utilizar una gran variedad de funciones preincorporadas, incluyendo funciones aritméticas,

funciones estadísticas, funciones de distribución y funciones de cadena.

Para calcular variables

1. Elija en los menús:

Transformar >Calcular variable...

2. Escriba el nombre de una sola variable objetivo. Puede ser una variable existente o una nueva que se

vaya a añadir al conjunto de datos activo.

3. Para crear una expresión, puede pegar los componentes en el campo Expresión o escribir directamente

en dicho campo.

vPuede pegar las funciones o las variables de sistema utilizadas habitualmente seleccionando un grupo

de la lista Grupo de funciones y pulsando dos veces en la función o variable de las listas de funciones

y variables especiales (o seleccione la función o variable y pulse en la flecha que se encuentra sobre la

lista Grupo de funciones). Rellene los parámetros indicados mediante interrogaciones (aplicable sólo a

las funciones). El grupo de funciones con la etiqueta Todo contiene una lista de todas las funciones y

variables de sistema disponibles. En un área reservada del cuadro de diálogo se muestra una breve

descripción de la función o variable actualmente seleccionada.

vLas constantes de cadena deben ir entre comillas o apóstrofos.

vSi los valores contienen decimales, debe utilizarse una coma(,) como indicador decimal.

vPara las nuevas variables de cadena, también deberán seleccionar Tipo y etiqueta para especificar el

tipo de datos.

Calcular variable: Si los casos

El cuadro de diálogo Si los casos permite aplicar transformaciones de los datos para subconjuntos de

casos seleccionados utilizando expresiones condicionales. Una expresión condicional devuelve un valor

verdadero,falso operdido para cada caso.

vSi el resultado de una expresión condicional es verdadero, se incluirá el caso en el subconjunto

seleccionado.

vSi el resultado de una expresión condicional es falso operdido, no se incluirá el caso en el subconjunto

seleccionado.

vLa mayoría de las expresiones condicionales utilizan al menos uno de los seis operadores de relación

(<, >, <=, >=, =, y ~=) de la calculadora.

vLas expresiones condicionales pueden incluir nombres de variable, constantes, operadores aritméticos,

funciones numéricas (y de otros tipos), variables lógicas y operadores de relación.

Calcular variable: Tipo y etiqueta

De forma predeterminada, las nuevas variables calculadas son numéricas. Para calcular una nueva

variable de cadena, deberá especificar el tipo de los datos y su ancho.

Etiqueta. Variable descriptiva opcional de hasta 255 bytes de longitud. Puede introducir una etiqueta o

utilizar los primeros 110 caracteres de la expresión de cálculo como la etiqueta.

Tipo. Las variables calculadas pueden ser numéricas o de cadena (alfanuméricas). Las variables de

cadena no se pueden utilizar en cálculos aritméticos.

Funciones

Se dispone de muchos tipos de funciones, entre ellos:

vFunciones aritméticas

vFunciones estadísticas

vFunciones de cadena

vFunciones de fecha y hora

vFunciones de distribución

vFunciones de variables aleatorias

vFunciones de valores perdidos

vFunciones de puntuación

Si desea obtener más información y una descripción detallada de cada función, escriba funciones en la

pestaña Índice del sistema de ayuda.

Valores perdidos en funciones

Las funciones y las expresiones aritméticas sencillas tratan los valores perdidos de diferentes formas. En

la expresión:

(var1+var2+var3)/3

El resultado es el valor perdido si un caso tiene un valor perdido para cualquiera de las tres variables.

En la expresión:

MEAN(var1, var2, var3)

El resultado es el valor perdido sólo si el caso tiene valores perdidos para las tres variables.

En las funciones estadísticas se puede especificar el número mínimo de argumentos que deben tener

valores no perdidos. Para ello, escriba un punto y el número mínimo de argumentos después del nombre

de la función, como en:

94 Guía del usuario de IBM SPSS Statistics 23 Core System

MEAN.2(var1, var2, var3)

Generadores de números aleatorios

El cuadro de diálogo Generadores de números aleatorios le permite seleccionar el generador de números

aleatorios y establecer el valor de secuencia de inicio de modo que pueda reproducir una secuencia de

números aleatorios.

Generador activo. Hay dos generadores de números aleatorios disponibles:

vCompatible con la versión 12. El generador de números aleatorios utilizado en la versión 12 y versiones

anteriores. Utilice este generador de números aleatorios si necesita reproducir los resultados

aleatorizados generados por versiones previas basadas en una semilla de aleatorización especificada.

vTornado de Mersenne. Un generador de números aleatorios nuevo que es más fiable en los procesos de

simulación. Utilice este generador de números aleatorios si no es necesario reproducir resultados

aleatorizados correspondientes a SPSS 12 o anteriores.

Inicialización del generador activo. La semilla de aleatorización cambia cada vez que se genera un

número aleatorio para utilizarlo en las transformaciones (como las funciones de distribución aleatorias), el

muestreo aleatorio o la ponderación de los casos. Para replicar una secuencia de números aleatorios,

establezca el valor de inicialización del punto de inicio antes de cada análisis que utilice los números

aleatorios. El valor debe ser un entero positivo.

Algunos procedimientos, como Modelos lineales, disponen de generadores de números aleatorios

internos.

Para seleccionar el generador de números aleatorios y establecer el valor de inicialización:

1. Elija en los menús:

Transformar >Generadores de números aleatorios

Contar apariciones de valores dentro de los casos

Este cuadro de diálogo crea una variable que, para cada caso, cuenta las apariciones del mismo valor, o

valores, en una lista de variables. Por ejemplo, un estudio podrá contener una lista de revistas con las

casillas de verificación sí/no para indicar qué revistas lee cada encuestado. Se podría contar el número de

respuestas sí de cada encuestado para crear una nueva variable que contenga el número total de revistas

leídas.

Para contar apariciones de valores dentro de los casos

1. Elija en los menús:

Transformar >Contar valores dentro de los casos...

2. Introduzca el nombre de la variable objetivo.

3. Seleccione dos o más variables del mismo tipo (numéricas o de cadena).

4. Pulse en Definir valores y especifique los valores que se deben contar.

Si lo desea, puede definir un subconjunto de casos en los que contar las apariciones de valores.

Contar valores dentro de los casos: Valores a contar

El valor de la variable objetivo (en el cuadro de diálogo principal) se incrementa en 1 cada vez que una

de las variables seleccionadas coincide con una especificación de la lista Valores a contar. Si un caso

coincide con varias de las especificaciones en cualquiera de las variables, la variable objetivo se

incrementa varias veces para esa variable.

Capítulo 8. Transformaciones de los datos 95

Las especificaciones de valores pueden incluir valores individuales, valores perdidos o valores perdidos

del sistema y rangos de valores. Los rangos incluyen sus puntos finales y los valores perdidos del usuario

que estén dentro del rango.

Contar apariciones: Si los casos

El cuadro de diálogo Si los casos permite contar apariciones de valores para un subconjunto de casos

seleccionado utilizando expresiones condicionales. Una expresión condicional devuelve un valor verdadero,

falso operdido para cada caso.

Valores de cambio

Cambiar valores crea nuevas variables que contienen los valores de variables existentes de casos

anteriores o posteriores.

Nombre. Nombre de la nueva variable. Debe ser un nombre que ya no existe en el conjunto de datos

activo.

Obtener el valor de un caso anterior (retardo). Obtener el valor de un caso anterior en el conjunto de

datos activo. Por ejemplo, con el número predeterminado del valor de casos 1, cada caso de la nueva

variable tiene el valor de la variable original del caso que la precede.

Obtener el valor del caso posterior (adelanto). Obtener el valor de un caso posterior en el conjunto de

datos activo. Por ejemplo, con el número predeterminado del valor de casos 1, cada caso de la nueva

variable tiene el valor de la variable original del caso siguiente.

Número de casos que se cambiarán. Obtener el valor del caso nanterior o siguiente, donde nes el valor

especificado. El valor debe ser un entero no negativo.

vSi se activa el procesamiento de segmentación de archivos, el cambio se limita a cada grupo de

segmentación. Un valor de cambio no se puede obtener a partir de un caso en un grupo de

segmentación anterior o posterior.

vEl estado del filtro se ignora.

vEl valor de la variable de resultado está definido como valores perdidos del sistema para el primer o

último caso ndel conjunto de datos o grupo de segmentación, donde nes el valor especificado para

Número de casos que se cambiarán. Por ejemplo, si utiliza el método de retardo con un valor de 1,

definirá la variable de resultados como valor perdidos del sistema para el primer caso del conjunto de

datos (o el primer caso en cada grupo de segmentación).

vSe conservan los valores perdidos del usuario.

vLa información del diccionario de la variable original, incluyendo etiquetas de valor definidas y

asignaciones de valores perdidos del usuario, se aplica a la nueva variable. (Nota: los atributos de la

variable personalizada no se incluyen).

vSe genera automáticamente una etiqueta de variable que describe la operación de cambio que ha

creado la variable.

Creación de una nueva variable con valores cambiados

1. Elija en los menús:

Transformar >Valores de cambio

2. Seleccione la variable que se utilizará como origen de los valores de la nueva variable.

3. Introduzca un nombre para la nueva variable.

4. Seleccione el método de cambio (retraso o adelanto) y el número de casos que se cambiarán.

5. Pulse en Cambiar.

6. Repita los pasos para cada nueva variable que desee crear.

96 Guía del usuario de IBM SPSS Statistics 23 Core System

Recodificación de valores

Los valores de datos se pueden modificar mediante la recodificación. Esto es particularmente útil para

agrupar o combinar categorías. Puede recodificar los valores dentro de las variables existentes o crear

variables nuevas que se basen en los valores recodificados de las variables existentes.

Recodificar en las mismas variables

El cuadro de diálogo Recodificar en las mismas variables le permite reasignar los valores de las variables

existentes o agrupar rangos de valores existentes en nuevos valores. Por ejemplo, podría agrupar los

salarios en categorías que sean rangos de salarios.

Puede recodificar las variables numéricas y de cadena. Si selecciona múltiples variables, todas deben ser

del mismo tipo. No se pueden recodificar juntas las variables numéricas y de cadena.

Para recodificar los valores de una variable

1. Elija en los menús:

Transformar >Recodificar en las mismas variables...

2. Seleccione las variables que desee recodificar. Si selecciona múltiples variables, todas deberán ser del

mismo tipo (numéricas o de cadena).

3. Pulse en Valores antiguos y nuevos y especifique cómo deben recodificarse los valores.

Si lo desea, puede definir un subconjunto de los casos para su recodificación. El cuadro de diálogo Si los

casos para esto es igual al que se describe para Contar apariciones.

Recodificar en las mismas variables: Valores antiguos y nuevos

Este cuadro de diálogo permite definir los valores que se van a recodificar. Todas las especificaciones de

valores deben pertenecer al mismo tipo de datos (numéricos o de cadena) que las variables seleccionadas

en el cuadro de diálogo principal.

Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede recodificar valores

individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos del sistema no se

pueden seleccionar para las variables de cadena, ya que ninguno de los conceptos es aplicable a estas

variables. Los rangos incluyen sus puntos finales y los valores perdidos del usuario que estén dentro del

rango.

vValor. Valor antiguo individual que se va recodificar en un valor nuevo. El valor debe ser el mismo

tipo de datos (numérico o de cadena) que el de las variables que se van recodificar.

vPerdido del sistema. Valores asignados por el programa cuando los valores de sus datos no están

definidos de acuerdo al tipo de formato que haya especificado, cuando un campo numérico está vacío,

o cuando no está definido un valor como resultado de un comando de transformación. Los valores

perdidos del sistema numéricos se muestran como puntos. Las variables de cadena no pueden tener

valores perdidos del sistema, ya que es lícito cualquier carácter en las variables de cadena.

vPerdido del sistema o perdido del usuario. Observaciones que tienen valores que el usuario ha declarado

perdidos o que son desconocidos y se les ha asignado el valor perdido del sistema, lo que se indica

mediante un punto (.)..

vRango. Rango inclusivo de valores. No disponible para variables de cadena. Se incluirá cualquier valor

perdido del usuario dentro del rango.

vTodos los demás valores. Cualquier valor no incluido en una de las especificaciones de la lista

Antiguo->Nuevo. Aparece en la lista Antiguo->Nuevo como ELSE.

Valor nuevo. Es el valor individual en el que se recodifica cada valor o rango de valores antiguo. Puede

introducir un valor o asignar el valor perdido del sistema.

Capítulo 8. Transformaciones de los datos 97

vValor. Valor en el que se va a recodificar uno o más valores antiguos. El tipo de datos (numérico o de

cadena) del valor introducido debe coincidir con el tipo de datos del valor antiguo.

vPerdido del sistema. Recodifica el valor antiguo especificado como valor perdido del sistema. El valor

perdido del sistema no se utiliza en los cálculos. Además, los casos con valor perdido del sistema se

excluyen de muchos procedimientos. No disponible para variables de cadena.

Antiguo->Nuevo. Contiene la lista de especificaciones que se va a utilizar para recodificar la variable o

las variables. Puede añadir, cambiar y borrar las especificaciones que desee. La lista se ordena

automáticamente basándose en la especificación del valor antiguo y siguiendo este orden: valores únicos,

valores perdidos, rangos y todos los demás valores. Si cambia una especificación de recodificación en la

lista, el procedimiento volverá a ordenar la lista automáticamente, si fuera necesario, para mantener este

orden.

Recodificar en distintas variables

El cuadro de diálogo Recodificar en distintas variables le permite reasignar los valores de las variables

existentes o agrupar rangos de valores existentes en nuevos valores para una variable nueva. Por ejemplo,

podría agrupar los salarios en una nueva variable que contenga categorías de rangos de salarios.

vPuede recodificar las variables numéricas y de cadena.

vPuede recodificar variables numéricas en variables de cadena y viceversa.

vSi selecciona múltiples variables, todas deben ser del mismo tipo. No se pueden recodificar juntas las

variables numéricas y de cadena.

Para recodificar los valores de una variable en una nueva variable

1. Elija en los menús:

Transformar >Recodificar en distintas variables...

2. Seleccione las variables que desee recodificar. Si selecciona múltiples variables, todas deberán ser del

mismo tipo (numéricas o de cadena).

3. Introduzca el nombre de la nueva variable de resultado para cada nueva variable y pulse en Cambiar.

4. Pulse en Valores antiguos y nuevos y especifique cómo deben recodificarse los valores.

Si lo desea, puede definir un subconjunto de los casos para su recodificación. El cuadro de diálogo Si los

casos para esto es igual al que se describe para Contar apariciones.

Recodificar en distintas variables: Valores antiguos y nuevos

Este cuadro de diálogo permite definir los valores que se van a recodificar.

Valor antiguo. Determina el valor o los valores que se van a recodificar. Puede recodificar valores

individuales, rangos de valores y valores perdidos. Los rangos y los valores perdidos del sistema no se

pueden seleccionar para las variables de cadena, ya que ninguno de los conceptos es aplicable a estas

variables. Los valores antiguos deben ser del mismo tipo de datos (numéricos o de cadena) que la

variable original. Los rangos incluyen sus puntos finales y los valores perdidos del usuario que estén

dentro del rango.

vValor. Valor antiguo individual que se va recodificar en un valor nuevo. El valor debe ser el mismo

tipo de datos (numérico o de cadena) que el de las variables que se van recodificar.

vPerdido del sistema. Valores asignados por el programa cuando los valores de sus datos no están

definidos de acuerdo al tipo de formato que haya especificado, cuando un campo numérico está vacío,

o cuando no está definido un valor como resultado de un comando de transformación. Los valores

perdidos del sistema numéricos se muestran como puntos. Las variables de cadena no pueden tener

valores perdidos del sistema, ya que es lícito cualquier carácter en las variables de cadena.

98 Guía del usuario de IBM SPSS Statistics 23 Core System

vPerdido del sistema o perdido del usuario. Observaciones que tienen valores que el usuario ha declarado

perdidos o que son desconocidos y se les ha asignado el valor perdido del sistema, lo que se indica

mediante un punto (.)..

vRango. Rango inclusivo de valores. No disponible para variables de cadena. Se incluirá cualquier valor

perdido del usuario dentro del rango.

vTodos los demás valores. Cualquier valor no incluido en una de las especificaciones de la lista

Antiguo->Nuevo. Aparece en la lista Antiguo->Nuevo como ELSE.

Valor nuevo. Es el valor individual en el que se recodifica cada valor o rango de valores antiguo. Los

valores nuevos pueden ser numéricos o de cadena.

vValor. Valor en el que se va a recodificar uno o más valores antiguos. El tipo de datos (numérico o de

cadena) del valor introducido debe coincidir con el tipo de datos del valor antiguo.

vPerdido del sistema. Recodifica el valor antiguo especificado como valor perdido del sistema. El valor

perdido del sistema no se utiliza en los cálculos. Además, los casos con valor perdido del sistema se

excluyen de muchos procedimientos. No disponible para variables de cadena.

vCopiar los valores antiguos. Conserva el valor antiguo. Si algunos de los valores no requieren la

recodificación, utilice esta opción para incluir los valores antiguos. Cualquier valor antiguo que no se

especifique no se incluye en la nueva variable, y los casos con esos valores se asignan al valor perdido

del sistema en la nueva variable.

Las variables de resultado son cadenas. Define la nueva variable recodificada como variable de cadena

(alfanumérica). La variable antigua puede ser numérica o de cadena.

Convertir cadenas numéricas en números. Convierte valores de cadena que contienen números a valores

numéricos. A las cadenas que contengan cualquier elemento que no sea número y un carácter de signo

opcional (+ ó -), se les asignará el valor perdido del sistema.

Antiguo->Nuevo. Contiene la lista de especificaciones que se va a utilizar para recodificar la variable o

las variables. Puede añadir, cambiar y borrar las especificaciones que desee. La lista se ordena

automáticamente basándose en la especificación del valor antiguo y siguiendo este orden: valores únicos,

valores perdidos, rangos y todos los demás valores. Si cambia una especificación de recodificación en la

lista, el procedimiento volverá a ordenar la lista automáticamente, si fuera necesario, para mantener este

orden.

Recodificación automática

El cuadro de diálogo Recodificación automática le permite convertir los valores numéricos y de cadena en

valores enteros consecutivos. Si los códigos de la categoría no son secuenciales, las casillas vacías

resultantes reducen el rendimiento e incrementan los requisitos de memoria de muchos procedimientos.

Además, algunos procedimientos no pueden utilizar variables de cadena y otros requieren valores enteros

consecutivos para los niveles de los factores.

vLa nueva variable, o variables, creadas por la recodificación automática conservan todas las etiquetas

de variable y de valor definidas de la variable antigua. Para los valores que no tienen una etiqueta de

valor ya definida se utiliza el valor original como etiqueta del valor recodificado. Una tabla muestra los

valores antiguos, los nuevos y las etiquetas de valor.

vLos valores de cadena se recodifican por orden alfabético, con las mayúsculas antes que las minúsculas.

vLos valores perdidos se recodifican como valores perdidos mayores que cualquier valor no perdido y

conservando el orden. Por ejemplo, si la variable original posee 10 valores no perdidos, el valor

perdido mínimo se recodificará como 11, y el valor 11 será un valor perdido para la nueva variable.

Usar el mismo esquema de recodificación para todas las variables. Esta opción le permite aplicar un

único esquema de recodificación para todas las variables seleccionadas, lo que genera un esquema de

codificación coherente para todas las variables nuevas.

Capítulo 8. Transformaciones de los datos 99

Si selecciona esta opción, se aplican las siguientes reglas y limitaciones:

vTodas las variables deben ser del mismo tipo (numéricas o de cadena).

vTodos los valores observados para todas las variables seleccionadas se utilizan para crear un orden de

valores para recodificar en enteros consecutivos.

vLos valores perdidos del usuario para las variables nuevas se basan en la primera variable de la lista

con valores perdidos del usuario. El resto de los valores de las demás variables originales, excepto los

valores perdidos del sistema, se consideran válidos.

Trate los valores de cadena en blanco como valores perdidos del usuario. En el caso de las variables de

cadena, los valores en blanco o nulos no son tratados como valores perdidos del sistema. Esta opción

recodifica automáticamente las cadenas en blanco en un valor perdido del usuario mayor que el valor no

perdido más alto.

Plantillas

Puede guardar el esquema de recodificación automática en un archivo de plantilla y, a continuación,

aplicarlo a otras variables y otros archivos de datos.

Por ejemplo, puede tener un número considerable de códigos de producto alfanuméricos que se registran

automáticamente en enteros cada mes, pero algunos meses se añaden códigos de productos nuevos al

esquema de recodificación original. Si guarda el esquema original en una plantilla y, a continuación, la

aplica a los datos nuevos que contienen el nuevo conjunto de códigos, todos los códigos nuevos

encontrados en los datos se recodifican automáticamente en valores superiores al último valor de la

plantilla para conservar el esquema de recodificación automática original de los códigos de productos

originales.

Guardar plantilla como. Guarda el esquema de recodificación automática para las variables seleccionadas

en un archivo de plantilla externo.

vLa plantilla contiene información que correlaciona los valores no perdidos originales a los valores

recodificados.

vEn la plantilla sólo se guarda la información para los valores no perdidos. La información sobre los

valores perdidos del usuario no se conserva.

vSi ha seleccionado varias variables para su recodificación, pero no ha optado por utilizar el mismo

esquema de recodificación automática para todas las variables o no va a aplicar una plantilla existente

como parte de la recodificación automática, la plantilla se basará en la primera variable de la lista.

vSi ha seleccionado varias variables para su recodificación, y también ha seleccionado Usar el mismo

esquema de recodificación para todas las variables y/o Aplicar plantilla, la plantilla contendrá el

esquema de recodificación automática combinado para todas las variables.

Aplicar plantilla desde. Aplica una plantilla de recodificación automática previamente guardada a las

variables seleccionadas para la recodificación, añade los valores adicionales encontrados en las variables

al final del esquema y conserva la relación entre los valores originales y recodificados automáticamente

almacenados en el esquema guardado.

vTodas las variables seleccionadas para la recodificación deben ser del mismo tipo (numéricas o de

cadena) y dicho tipo debe coincidir con el tipo definido en la plantilla.

vLas plantillas no pueden contener información sobre los valores perdidos del usuario. Los valores

perdidos del usuario para las variables de destino se basan en la primera variable de la lista de

variables originales con valores perdidos del usuario. El resto de los valores de las demás variables

originales, excepto los valores perdidos del sistema, se consideran válidos.

vLas correlaciones de valores de la plantilla se aplican en primer lugar. Los valores restantes se

recodifican en valores superiores al último valor de la plantilla, con los valores perdidos del usuario

(basados en la primera variable de la lista con valores perdidos del usuario) recodificados en valores

superiores al último valor válido.

100 Guía del usuario de IBM SPSS Statistics 23 Core System

vSi ha seleccionado diversas variables para su recodificación automática, la plantilla se aplica en primer

lugar, seguida de una recodificación automática común combinada para todos los valores adicionales

encontrados en las variables seleccionadas, lo que resulta en un único esquema de recodificación

automática para todas las variables seleccionadas.

Para recodificar valores numéricos o de cadena en valores enteros consecutivos

1. Elija en los menús:

Transformar >Recodificación automática...

2. Seleccione la variable o variables que desee recodificar.

3. Para cada variable seleccionada, introduzca un nombre para la nueva variable y pulse en Nuevo

nombre.

Casos de rangos

El cuadro de diálogo Asignar rangos a los casos le permite crear nuevas variables que contienen rangos,

puntuaciones de Savage y normales, y los valores de los percentiles para las variables numéricas.

Los nombres de las nuevas variables y las etiquetas de variable descriptivas se generan automáticamente

en función del nombre de la variable original y de las medidas seleccionadas. Una tabla de resumen

presenta una lista de las variables originales, las nuevas variables y las etiquetas de variable. (Nota: los

nombres de nuevas variables generados automáticamente se limitan a una longitud máxima de 8 bytes).

Si lo desea, puede:

vAsignar los rangos a los casos en orden ascendente o descendente.

vOrganizar las clasificaciones en subgrupos seleccionando una o más variables de agrupación para la

lista Por. Los rangos se calculan dentro de cada grupo, y los grupos se definen mediante la

combinación de los valores de las variables de agrupación. Por ejemplo, si selecciona sexo yminoría

como variables de agrupación, los rangos se calcularán para cada combinación de sexo yminoría.

Para asignar rangos a los casos

1. Elija en los menús:

Transformar >Asignar rangos a casos...

2. Seleccione la variable o variables a las que desee asignar los rangos. Sólo se pueden asignar rangos a

las variables numéricas.

Si lo desea, puede asignar los rangos a los casos en orden ascendente o descendente y organizar los

rangos por subgrupos.

Asignar rangos a los casos: Tipos

Puede seleccionar diversos métodos de clasificación. En cada método se crea una variable diferente de

clasificación. Los métodos de clasificación incluyen rangos sencillos, puntuaciones de Savage, rangos

fraccionales y percentiles. También puede crear clasificaciones basadas en estimaciones de la proporción y

puntuaciones normales.

Rango. El rango simple. El valor de la nueva variable es igual a su rango.

Puntuación de Savage. La nueva variable contiene puntuaciones de Savage basadas en una distribución

exponencial.

Rango fraccional. El valor de la nueva variable es igual al rango dividido por la suma de las

ponderaciones de los casos no perdidos.

Capítulo 8. Transformaciones de los datos 101

Rango fraccional como porcentaje. Cada rango se divide por el número de casos que tienes valores válidos y

se multiplica por 100.

Suma de ponderaciones de los casos. El valor de la nueva variable es igual la suma de las ponderaciones de

los casos. La nueva variable es una constante para todos los casos del mismo grupo.

Ntiles. Los rangos se basan en los grupos percentiles, de forma que cada uno de los grupos contenga

aproximadamente el mismo número de casos. Por ejemplo, con 4 Ntiles se asignará un rango1alos

casos por debajo del percentil 25, 2 a los casos entre los percentiles 25 y 50, 3 a los casos entre los

percentiles 50 y 75,y4aloscasos por encima del percentil 75.

Estimaciones de la proporción. Estimaciones de la proporción acumulada de la distribución que corresponde

a un rango particular.

Puntuaciones normales. Puntuaciones Z correspondientes a la proporción acumulada estimada.

Fórmula de estimación de la proporción. Para las estimaciones de proporción y puntuaciones normales,

puede seleccionar la fórmula de la estimación de la proporción: Blom,Tukey,Rankit oVan der Waerden.

vBlom. Crea nuevas variables de clasificación que se basan en estimaciones de la proporción, las cuales

utilizan la fórmula (r-3/8) / (w+1/4), donde r es el rangoyweslasuma de las ponderaciones de los

casos.

vTukey. Utiliza la fórmula (r-1/3) / (w+1/3), donde r es el rangoyweslasuma de las ponderaciones

de los casos.

vRankit. Utiliza la fórmula (r-1/2) / w, donde w es el número de observacionesyreselrango, que va

de1aw.

vVan der Waerden. La transformación de Van de Waerden, definida por la fórmula r/(w+1), donde w es

la suma de las ponderaciones de los casosyreselrango, cuyo valor va de1aw.

Asignar rangos a los casos: Empates

Este cuadro de diálogo controla el método de asignación de clasificaciones a los casos con el mismo valor

en la variable original.

La tabla siguiente muestra cómo los distintos métodos asignan rangos a los valores empatados.

Tabla 7. Métodos de clasificación y resultados

Valor Media Bajo Alto Secuencial

10 1 1 1 1

15 3 2 4 2

16 5 5 5 3

20 6 6 6 4

Asistente de fecha y hora

El Asistente para fecha y hora simplifica ciertas tareas comunes asociadas a las variables de fecha y hora.

Para usar el Asistente para fecha y hora

1. Elija en los menús:

Transformar >Asistente para fecha y hora...

2. Seleccione la tarea que desee realizar y siga los pasos para definir la tarea.

102 Guía del usuario de IBM SPSS Statistics 23 Core System

vAprender cómo se representan las fechas y las horas. Esta opción ofrece una pantalla en la que se

presenta una breve descripción de las variables de fecha/hora en IBM SPSS Statistics. El botón Ayuda

también proporciona un enlace para obtener información más detallada.

vCrear una variable de fecha/hora a partir de una cadena que contiene una fecha o una hora. Use

esta opción para crear una variable de fecha/hora a partir de una variable de cadena. Por ejemplo,

dispone de una variable de cadena que representa fechas con el formato mm/dd/aaaa y desea crear

una variable de fecha/hora a partir de ella.

vCrear una variable de fecha/hora fusionando variables que contengan partes diferentes de la fecha

u hora. Esta opción permite construir una variable de fecha/hora a partir de un conjunto de variables

existentes. Por ejemplo, dispone de una variable que representa el mes (como un número entero), una

segunda que representa el día del mes y una tercera que representa el año. Se pueden combinar estas

variables en una única variable de fecha/hora.

vRealizar cálculos con fechas y horas. Use esta opción para añadir o sustraer valores a variables de

fecha/hora. Por ejemplo, puede calcular la duración de un proceso sustrayendo una variable que

represente la hora de comienzo del proceso de otra variable que represente la hora de finalización del

proceso.

vExtraer una parte de una variable de fecha/hora. Esta opción permite extraer parte de una variable de

fecha/hora, como el día del mes de una variable de fecha/hora, con el formato mm/dd/aaaa.

vAsignar periodicidad a un conjunto de datos. Esta opción presenta el cuadro de diálogo Definir

fechas, que se usa para crear variables de fecha/hora compuestas por un conjunto de fechas

secuenciales. Esta característica se usa generalmente para asociar fechas con datos de serie temporal.

Nota: las tareas se desactivan cuando el conjunto de datos carece de los tipos de variables necesarios para

completar la tarea. Por ejemplo, si el conjunto de datos no contiene variables de cadena, la tarea de

creación de una variable de fecha/hora a partir de una cadena no se aplica y se desactiva.

Fechas y horas en IBM SPSS Statistics

Las variables que representan fechas y horas en IBM SPSS Statistics tienen un tipo de variable numérico,

con formatos de presentación que se corresponden con los formatos específicos de fecha/hora. Estas

variables se denominan generalmente variables de fecha/hora. Se distingue entre variables de fecha/hora

que realmente representan fechas y aquellas que representan una duración temporal independiente de

cualquier fecha, como 20 horas, 10 minutos y 15 segundos. Éstas últimas se denominan generalmente

variables de duración, mientras que las primeras se conocen como variables de fecha o de fecha/hora.

Para obtener una lista completa de los formatos de presentación, consulte "Fecha y hora" en la sección

"Universales" de la referencia de sintaxis de comandos.

Variables de fecha y de fecha/hora Las variables de fecha tienen un formato que representa una fecha,

como mm/dd/aaaa. Las variables de fecha/hora tienen un formato que representa una fecha y una hora,

como dd-mmm-aaaa hh:mm:ss. Internamente, las variables de fecha y de fecha/hora se almacenan como

el número de segundos a partir del 14 de octubre de 1582. Las variables de fecha y de fecha/hora se

denominan a menudo variables con formato de fecha.

vLas especificaciones de año reconocidas son tanto de dos como de cuatro dígitos. De forma

predeterminada, los años representados por dos dígitos representan un intervalo que comienza 69 años

antes de la fecha actual y finaliza 30 años después de la fecha actual. Este intervalo está determinado

por la configuración de las Opciones y se puede modificar (en el menú Edición, seleccione Opciones y

pulse en la pestaña Datos).

vLos delimitadores que se pueden usar en los formatos de día-mes-año son guiones, puntos, comas,

barras inclinadas y espacios en blanco.

vLos meses se pueden representar en dígitos, números romanos o abreviaturas de tres caracteres, y se

pueden escribir con el nombre completo. Los nombres de los meses expresados con abreviaturas de

tres letras y nombres completos deben estar en inglés, ya que no se reconocen los nombres de meses en

otros idiomas.

Capítulo 8. Transformaciones de los datos 103

Variables de duración. Las variables de duración tienen un formato que representa una duración de

tiempo, como hh:mm. Se almacenan internamente como segundos sin hacer referencia a ninguna fecha en

particular.

vEn las especificaciones de tiempo (se aplican a las variables de fecha/hora y de duración), los dos

puntos se pueden usar como delimitadores entre horas, minutos y segundos. Las horas y los minutos

son valores necesarios, pero los segundos son opcionales. Para separar los segundos de las fracciones

de segundo, es necesario utilizar un punto. Las horas pueden tener una magnitud ilimitada, pero el

valor máximo de los minutos es 59 y el de los segundos, 59.999...

Fecha y hora actuales. La variable del sistema $TIME contiene la fecha y hora actuales. Representa el

número de segundos transcurridos desde el 14 de octubre de 1582 hasta la fecha y la hora en que se

ejecute el comando de transformación que la use.

Creación de una variable de fecha/hora a partir de una cadena

Para crear una variable de fecha/hora a partir de una variable de cadena:

1. Seleccione Crear una variable de fecha/hora a partir de una variable de cadena que contenga una

fecha u hora en la pantalla principal del Asistente para fecha y hora.

Selección de una variable de cadena para convertir en una variable de fecha/hora

1. En la lista Variables, seleccione la variable de cadena que desee convertir. Observe que la lista sólo

contiene variables de cadena.

2. En la lista Patrones, seleccione el patrón que coincida con el modo en que la variable de cadena

representa las fechas. La lista Valores de ejemplo muestra los valores reales de la variable seleccionada

en el archivo de datos. Los valores de la variable de cadena que no se ajusten al patrón seleccionado

darán como resultado un valor perdido del sistema para la nueva variable.

Especificación del resultado de convertir la variable de cadena en variable de

fecha/hora

1. Escriba un nombre para la variable de resultado. Éste no puede coincidir con el de una variable

existente.

Si lo desea, puede:

vSeleccionar un formato de fecha/hora para la nueva variable en la lista Formato de resultado.

vAsignar una etiqueta de variable descriptiva a la nueva variable.

Creación de una variable de fecha/hora a partir de un conjunto de

variables

Para fusionar un conjunto de variables existentes en una única variable de fecha/hora:

1. Seleccione Crear una variable de fecha/hora fusionando variables que contengan partes diferentes

de la fecha u hora en la pantalla principal del Asistente para fecha y hora.

Selección de variables que fusionar en una única variable de fecha/hora

1. Seleccione las variables que representen las diferentes partes de la fecha/hora.

vAlgunas combinaciones de selecciones no están permitidas. Por ejemplo, la creación de una variable de

fecha/hora a partir de un valor de Año y Día del mes no es válida porque, una vez seleccionado Año,

es necesario especificar una fecha completa.

vNo se puede utilizar una variable de fecha/hora existente como una de las partes de la variable de

fecha/hora final que se está creando. Las variables que componen las partes de la nueva variable de

fecha/hora deben ser números enteros. La excepción es el uso permitido de una variable de fecha/hora

existente como la parte de los segundos de la nueva variable. Puesto que se permite el uso de

fracciones de segundos, las variables utilizadas para los segundos no tiene que ser obligatoriamente un

número entero.

104 Guía del usuario de IBM SPSS Statistics 23 Core System

vLos valores de cualquier parte de la nueva variable que no se ajusten al rango permitido darán como

resultado un valor perdido del sistema para la nueva variable. Por ejemplo, si se usa inadvertidamente

una variable que representa un día del mes como valor de Mes, todos los casos en que el valor del día

del mes pertenezca al rango 14–31 se considerarán valores perdidos del sistema para la nueva variable,

puesto que el rango válido para los meses en IBM SPSS Statistics es 1–13.

Especificación de variable de fecha/hora creada fusionando variables

1. Escriba un nombre para la variable de resultado. Éste no puede coincidir con el de una variable

existente.

2. Seleccione un formato de fecha/hora de la lista Formato de resultado.

Si lo desea, puede:

vAsignar una etiqueta de variable descriptiva a la nueva variable.

Adición o sustracción de valores a partir de variables de fecha/hora

Para añadir o sustraer valores a variables de fecha/hora:

1. Seleccione Calcular con fechas y horas en la pantalla principal del Asistente para fecha y hora.

Selección del tipo de cálculo que realizar con las variables de fecha/hora

vAñadir o sustraer una duración a una fecha. Use esta opción para añadir o sustraer valores a una

variable con formato de fecha. Si lo desea, puede añadir o sustraer duraciones que sean valores fijos,

como 10 días, o los valores de una variable numérica (por ejemplo, una variable que represente años).

vCalcular el número de unidades de tiempo entre dos fechas. Use esta opción para obtener la

diferencia entre dos fechas medidas en una unidad seleccionada. Por ejemplo, puede obtener el número

de años o el número de días que separan dos fechas.

vSustraer dos duraciones. Use esta opción para obtener la diferencia entre dos variables con formatos

de duración, como hh:mm o hh:mm:ss.

Nota: las tareas se desactivan cuando el conjunto de datos carece de los tipos de variables necesarios para

completar la tarea. Por ejemplo, si el conjunto de datos no contiene dos variables con formatos de

duración, la tarea de sustracción de dos duraciones no se aplica y se desactiva.

Adición o sustracción de una duración a una fecha

Para añadir o sustraer una duración a una variable con formato de fecha:

1. Seleccione Añadir o sustraer una duración a una fecha en la pantalla del Asistente para fecha y hora

denominada Realizar cálculos con las fechas.

Selección de variable de fecha/hora y duración que añadir o sustraer:

1. Seleccione una variable de fecha (u hora).

2. Seleccione una variable de duración o especifique un valor para Constante de duración. Las variables

utilizadas para las duraciones no pueden ser variables de fecha o de fecha/hora. Pueden ser variables

de duración o variables numéricas simples.

3. Seleccione la unidad que represente la duración en la lista desplegable. Seleccione Duración si se usa

una variable y ésta tiene el formato de una duración, como hh:mm o hh:mm:ss.

Especificación de los resultados de la adición o sustracción de una duración a una variable de

fecha/hora:

1. Escriba un nombre para la variable de resultado. Éste no puede coincidir con el de una variable

existente.

Si lo desea, puede:

vAsignar una etiqueta de variable descriptiva a la nueva variable.

Capítulo 8. Transformaciones de los datos 105

Sustracción de variables con formato de fecha

Para sustraer dos variables con formato de fecha:

1. Seleccione Calcular el número de unidades de tiempo entre dos fechas en la pantalla del Asistente

para fecha y hora denominada Realizar cálculos con las fechas.

Selección de variables con formato de fecha que sustraer:

1. Seleccione las variables que se van a sustraer.

2. Seleccione la unidad del resultado en la lista desplegable.

3. Seleccione cómo debería calcularse el resultado (tratamiento de resultado).

Tratamiento resultante

Las siguientes opciones están disponibles para el cálculo del resultado:

vTruncar a número entero. Se ignora cualquier parte fraccional del resultado. Por ejemplo, si se resta

28/10/2006 de 21/10/2007 se obtiene un resultado de 0 para los años y 11 para los meses.

vRedondear a número entero. El resultado se redondea al número entero más cercano. Por ejemplo, si

se resta 28/10/2006 de 21/10/2007 se obtiene un resultado de 1 para los años y 12 para los meses.

vConservar parte fraccional. Se conserva el valor completo, sin truncar ni redondear el resultado. Por

ejemplo, si se resta 28/10/2006 de 21/10/2007 se obtiene un resultado de 0,98 para los años y 11,76

para los meses.

En el caso del redondeo y la conservación fraccional, el resultado para los años se basa en el número

medio de días de un año (365,25), y el resultado para los meses se basa en el número medio de días de

un mes (30,4375). Por ejemplo, si se resta 1/2/2007 de 1/3/2007 (formato d/m/a) devuelve un resultado

fraccional de 0,92 meses; en cambio, si se resta 1/3/2007 de 1/2/2007 devuelve una diferencia fraccional

de 1,02 meses. Esto también afecta a los valores calculados en periodos de tiempo que incluyen años

bisiestos. Por ejemplo, si se resta 1/2/2008 de 1/3/2008 devuelve una diferencia fraccional de 0,95 meses,

en comparación con los 0,92 para el mismo periodo de tiempo en un año no bisiesto.

Tabla 8. Diferencia de fecha para años

Fecha 1 Fecha 2 Truncado Redondeado Fracción

21/10/2006 28/10/2007 1 1 1,02

28/10/2006 21/10/2007 0 1 0,98

1/2/2007 1/3/2007 0 0 0,08

1/2/2008 1/3/2008 0 0 0,08

1/3/2007 1/4/2007 0 0 0,08

1/4/2007 1/5/2007 0 0 0,08

Tabla 9. Diferencia de fecha para meses

Fecha 1 Fecha 2 Truncado Redondeado Fracción

21/10/2006 28/10/2007 12 12 12,22

28/10/2006 21/10/2007 11 12 11,76

1/2/2007 1/3/2007 1 1 0,92

1/2/2008 1/3/2008 1 1 0,95

1/3/2007 1/4/2007 1 1 1,02

1/4/2007 1/5/2007 1 1 0,99

106 Guía del usuario de IBM SPSS Statistics 23 Core System

Especificación del resultado de la sustracción de dos variables con formato de fecha:

1. Escriba un nombre para la variable de resultado. Éste no puede coincidir con el de una variable

existente.

Si lo desea, puede:

vAsignar una etiqueta de variable descriptiva a la nueva variable.

Sustracción de variables de duración

Para sustraer dos variables de duración:

1. Seleccione Sustraer dos duraciones en la pantalla del Asistente para fecha y hora denominada Realizar

cálculos con las fechas.

Selección de las variables de duración que sustraer:

1. Seleccione las variables que se van a sustraer.

Especificación del resultado de la sustracción de dos variables de duración:

1. Escriba un nombre para la variable de resultado. Éste no puede coincidir con el de una variable

existente.

2. Seleccione un formato de duración de la lista Formato de resultado.

Si lo desea, puede:

vAsignar una etiqueta de variable descriptiva a la nueva variable.

Extracción de parte de una variable de fecha/hora

Para extraer un componente, como puede ser el año, de una variable de fecha/hora:

1. Seleccione Extraer una parte de una variable de fecha u hora en la pantalla principal del Asistente

para fecha y hora.

Selección de componente que extraer de una variable de fecha/hora

1. Seleccione la variable que contiene la parte de fecha u hora que desee extraer.

2. En la lista desplegable, seleccione la parte de la variable que se va a extraer. Si lo desea, puede extraer

información de fechas que no sea explícitamente parte de la fecha que se muestra, por ejemplo, un día

de la semana.

Especificación del resultado de la extracción de un componente de una variable

de fecha/hora

1. Escriba un nombre para la variable de resultado. Éste no puede coincidir con el de una variable

existente.

2. Si está extrayendo la parte de fecha o de hora de una variable de fecha/hora, debe seleccionar un

formato de la lista Formato de resultado. En los casos en que el formato de resultado no es necesario

se desactivará la lista Formato de resultado.

Si lo desea, puede:

vAsignar una etiqueta de variable descriptiva a la nueva variable.

Transformaciones de los datos de serie temporal

Se incluyen diversas transformaciones de datos de gran utilidad en los análisis de series temporales:

vGenerar variables de fecha para establecer la periodicidad y distinguir entre los períodos históricos, de

validación y de predicción.

vElaborar nuevas variables de series temporales como funciones de variables de series temporales

existentes.

Capítulo 8. Transformaciones de los datos 107

vReemplazar valores perdidos del usuario y perdidos del sistema con estimaciones basadas en uno de

los diversos métodos existentes.

Una serie temporal se obtiene midiendo una variable (o un conjunto de variables) de manera regular a lo

largo de un período de tiempo. Las transformaciones de los datos de serie temporal suponen una

estructura de archivo de datos en la que cada caso (fila) representa un conjunto de observaciones para un

momento diferente y la duración del tiempo entre los casos es uniforme.

Definir fechas

El cuadro de diálogo Definir fechas genera variables de fecha que se pueden utilizar para establecer la

periodicidad de una serie temporal y para etiquetar los resultados de los análisis de series temporales.

Los casos son. Define el intervalo de tiempo utilizado para generar las fechas.

vSin fecha elimina las variables de fecha definidas anteriormente. Se suprimirán las variables con los

nombres siguientes: año_,trimestre_,mes_,semana_,día_,hora_,minuto_,segundo_ yfecha_.

vPersonalizado indica la presencia de variables de fecha personalizadas, creadas con la sintaxis de

comandos (por ejemplo, una semana de cuatro días laborables). Este elemento simplemente refleja el

estado actual del conjunto de datos activo. Su selección en la lista no produce ningún efecto.

El primer caso es. Define el valor de la fecha inicial, que se asigna al primer caso. A los casos

subsiguientes se les asignan valores secuenciales, basándose en el intervalo de tiempo.

Periodicidad a nivel superior. Indica la variación cíclica repetitiva, como el número de meses de un año

o el número de días de la semana. El valor mostrado indica el valor máximo que se puede introducir.

Para horas, minutos y segundos, el valor máximo es el valor que se muestra menos uno.

Para cada componente utilizado para definir la fecha, se crea una nueva variable numérica. Los nombres

de las nuevas variables terminan con un carácter de subrayado. A partir de los componentes también se

crea una variable de cadena descriptiva, fecha_. Por ejemplo, si ha seleccionado Semanas, días, horas,se

crean cuatro variables: semana_,día_,hora_ yfecha_.

Si ya se han definido variables de fecha, éstas serán reemplazadas cuando se definan nuevas variables de

fecha con los mismos nombres que las existentes.

Para definir fechas para los datos de serie temporal

1. Elija en los menús:

Datos >Definir fechas...

2. Seleccione un intervalo de tiempo en la lista Los casos son.

3. Introduzca el valor o los valores que definen la fecha inicial en El primer caso es, que determina la

fecha asignada al primer caso.

Variables de fecha frente a variables con formato de fecha

Las variables de fecha creadas con Definir fechas no deben confundirse con las variables con formato de

fecha, que se definen en Vista de variables del Editor de datos. Las variables de fecha se emplean para

establecer la periodicidad de los datos de serie temporal; mientras que las variables con formato de fecha

representan fechas y horas mostradas en varios formatos de fecha y hora. Las variables de fecha son

números enteros sencillos que representan el número de días, semanas, horas, etc., a partir de un punto

inicial especificado por el usuario. Internamente, la mayoría de las variables con formato de fecha se

almacenan como el número de segundos transcurridos desde el 14 de octubre de 1582.

Crear serie temporal

El cuadro de diálogo Crear serie temporal crea nuevas variables basadas en funciones de variables de

series temporales numéricas existentes. Estos valores transformados son de gran utilidad en muchos

procedimientos de análisis de series temporales.

108 Guía del usuario de IBM SPSS Statistics 23 Core System

Los nombres predeterminados de las nuevas variables se componen de los seis primeros caracteres de las

variables existentes utilizadas para crearlas, seguidos por un carácter de subrayado y un número

secuencial. Por ejemplo, para la variable precio, el nombre de la nueva variable sería precio_1. Las nuevas

variables conservarían cualquier etiqueta de valor definida de las variables originales.

Las funciones disponibles para crear variables de series temporales incluyen las funciones de diferencias,

medias móviles, medianas móviles, retardo y adelanto.

Para crear una nueva variable de serie temporal

1. Elija en los menús:

Transformar >Crear serie temporal...

2. Seleccione la función de serie temporal que desea utilizar para transformar la variable o variables

originales.

3. Seleccione la variable o variables a partir de las cuales desee crear nuevas variables de serie temporal.

Sólo se pueden utilizar variables numéricas.

Si lo desea, puede:

vIntroducir nombres de variables, para omitir los nombres predeterminados de las nuevas variables.

vCambiar la función para una variable seleccionada.

Funciones de transformación de series temporales

Diferencia. Diferencia no estacional entre valores sucesivos de la serie. El orden es el número de valores

previos utilizados para calcular la diferencia. Dado que se pierde una observación para cada orden de

diferencia, aparecerán valores perdidos del sistema al comienzo de la serie. Por ejemplo, si el orden de

diferencia es 2, los primeros dos casos tendrán el valor perdido del sistema para la nueva variable.

Diferencia estacional. Diferencia los valores de la serie respecto a los valores de la propia serie

distanciados un orden (un lapso) de valores constante. El orden se basa en la periodicidad definida

actualmente. Para calcular diferencias estacionales debe haber definido variables de fecha (menú Datos,

Definir fechas) que incluyan un componente estacional (como por ejemplo los meses del año). El orden es

el número de períodos estacionales utilizados para calcular la diferencia. El número de casos con el valor

perdido del sistema al comienzo de la serie es igual a la periodicidad multiplicada por el orden de la

diferencia estacional. Por ejemplo, si la periodicidad actual es 12 y el orden es 2, los primeros 24 casos

tendrán el valor perdido del sistema para la nueva variable.

Media móvil centrada. Se utiliza el promedio de un rango de los valores de la serie, que rodean e

incluyen al valor actual. La amplitud es el número de valores de la serie utilizados para calcular el

promedio. Si la amplitud es par, la media móvil se calcula con el promedio de cada par de medias no

centradas. Número de casos con el valor perdido del sistema al comienzo y al final de la serie para una

amplitud de nes igual a n/2 para los valores de la amplitud par y (n-1)/2 para los valores de la

amplitud impar. Por ejemplo, si la amplitud es 5, el número de casos con el valor perdido del sistema al

comienzo y al final de la serie es 2.

Media móvil anterior. Se utiliza el promedio de un rango de las observaciones precedentes. La amplitud

es el número de valores precedentes de la serie utilizados para calcular el promedio. El número de casos

con el valor perdido del sistema al comienzo de la serie es igual al valor de la amplitud.

Medianas móviles. Se utiliza la mediana de un rango de los valores de la serie, que rodean e incluyen al

valor actual. La amplitud es el número de valores de la serie utilizados para calcular la mediana. Si la

amplitud es par, la mediana se calcula con el promedio de cada par de medianas no centradas. Número

de casos con el valor perdido del sistema al comienzo y al final de la serie para una amplitud de nes

igual a n/2 para los valores de la amplitud par y (n-1)/2 para los valores de la amplitud impar. Por

ejemplo, si la amplitud es 5, el número de casos con el valor perdido del sistema al comienzo y al final

de la serie es 2.

Capítulo 8. Transformaciones de los datos 109

Suma acumulada. Cada valor de la serie se sustituye por la suma acumulada de los valores precedentes,

incluyendo el valor actual.

Retardo. Cada valor de la serie se sustituye por el valor del caso precedente, en el orden especificado. El

orden especifica a qué distancia se encuentra el caso precedente. El número de casos con el valor perdido

del sistema al comienzo de la serie es igual al valor del orden.

Adelanto. Cada valor de la serie se sustituye por el valor de un caso posterior, en el orden especificado.

El orden especifica a qué distancia se encuentra el caso posterior. El número de casos con el valor perdido

del sistema al final de la serie es igual al valor del orden.

Suavizado. Los nuevos valores de la serie se basan en un suavizador de datos compuesto. El suavizador

comienza con una mediana móvil de 4, que se centra por una mediana móvil de 2. A continuación, se

vuelven a suavizar estos valores aplicando una mediana móvil de 5, una mediana móvil de3ylos

promedios ponderados móviles (hanning). Los residuos se calculan sustrayendo la serie suavizada de la

serie original. Después se repite todo el proceso sobre los residuos calculados. Por último, los residuos

suavizados se calculan sustrayendo los valores suavizados obtenidos la primera vez que se realizó el

proceso. A esto se le denomina a veces suavizado T4253H.

Reemplazar los valores perdidos

Las observaciones perdidas pueden causar problemas en los análisis y algunas medidas de series

temporales no se pueden calcular si hay valores perdidos en la serie. En ocasiones el valor para una

observación concreta no se conoce. Además, los datos perdidos pueden ser el resultado de lo siguiente:

vCada grado de diferenciación reduce la longitud de una serie en 1.

vCada grado de diferenciación estacional reduce la longitud de una serie en una estación.

vSi genera una serie nueva que contenga previsiones que sobrepasen el final de la serie existente (al

pulsar en el botón Guardar y realizar las selecciones adecuadas), la serie original y la serie residual

generada incluirán datos perdidos para las observaciones nuevas.

vAlgunas transformaciones (por ejemplo, la transformación logarítmica) generan datos perdidos para

determinados valores de la serie original.

Los valores perdidos al principio o fin de una serie no suponen un problema especial; sencillamente

acortan la longitud útil de la serie. Las discontinuidades que aparecen en mitad de una serie (datos

incrustados perdidos) pueden ser un problema mucho más grave. El alcance del problema depende del

procedimiento analítico que se utilice.

El cuadro de diálogo Reemplazar valores perdidos crea nuevas variables de series temporales a partir de

otras existentes, reemplazando los valores perdidos por estimaciones calculadas mediante uno de los

distintos métodos posibles. Los nombres predeterminados de las nuevas variables se componen de los

seis primeros caracteres de las variables existentes utilizadas para crearlas, seguidos por un carácter de

subrayado y un número secuencial. Por ejemplo, para la variable precio, el nombre de la nueva variable

sería precio_1. Las nuevas variables conservarían cualquier etiqueta de valor definida de las variables

originales.

Para reemplazar los valores perdidos para las variables de series temporales

1. Elija en los menús:

Transformar >Reemplazar valores perdidos...

2. Seleccione el método de estimación que desee utilizar para reemplazar los valores perdidos.

3. Seleccione la variable o variables para las que desea reemplazar los valores perdidos.

Si lo desea, puede:

vIntroducir nombres de variables, para omitir los nombres predeterminados de las nuevas variables.

vCambiar el método de estimación para una variable seleccionada.

110 Guía del usuario de IBM SPSS Statistics 23 Core System

Métodos de estimación para reemplazar los valores perdidos

Media de la serie. Sustituye los valores perdidos con la media de la serie completa.

Media de puntos adyacentes. Sustituye los valores perdidos por la media de los valores válidos

circundantes. La amplitud de los puntos adyacentes es el número de valores válidos, por encima y por

debajo del valor perdido, utilizados para calcular la media.

Mediana de puntos adyacentes. Sustituye los valores perdidos por la mediana de los valores válidos

circundantes. La amplitud de los puntos adyacentes es el número de valores válidos, por encima y por

debajo del valor perdido, utilizados para calcular la mediana.

Interpolación lineal. Sustituye los valores perdidos utilizando una interpolación lineal. Se utilizan para la

interpolación el último valor válido antes del valor perdido y el primer valor válido después del valor

perdido. Si el primer o el último caso de la serie tiene un valor perdido, el valor perdido no se sustituye.

Tendencia lineal en el punto. Reemplaza los valores perdidos de la serie por la tendencia lineal en ese

punto. Se hace una regresión de la serie existente sobre una variable índice escalada de 1 a n. Los valores

perdidos se sustituyen por sus valores pronosticados.

Capítulo 8. Transformaciones de los datos 111

112 Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 9. Gestión y transformación de los archivos

Gestión y transformación de los archivos

Los archivos de datos no siempre están organizados de la forma ideal para las necesidades específicas del

usuario. Puede que le interese combinar archivos de datos, organizar los datos en un orden diferente,

seleccionar un subconjunto de casos o cambiar la unidad de análisis agrupando casos. Entre la amplia

gama de posibilidades de transformación de archivos disponibles se encuentran las siguientes:

Ordenar datos. Puede ordenar los casos en función del valor de una o más variables.

Transponer casos y variables. El formato de archivo de datos IBM SPSS Statistics lee las filas como casos

y las columnas como variables. Para los archivos de datos en los que el orden está invertido, se pueden

intercambiar las filas y las columnas para leer los datos en el formato correcto.

Fusionar archivos. Puede fundir dos o más archivos de datos. Es posible combinar archivos con las

mismas variables pero con casos distintos, o con los mismos casos pero variables diferentes.

Seleccionar subconjuntos de casos. Puede restringir el análisis a un subconjunto de casos o efectuar

análisis simultáneos de subconjuntos diferentes.

Agregar datos. Puede cambiar la unidad de análisis agregando casos basados en el valor de una o más

variables de agrupación.

Ponderar datos. Puede ponderar los casos para un análisis basado en el valor de una variable de

ponderación.

Reestructurar datos. Puede reestructurar los datos para crear un único caso (registro) a partir de varios

casos o crear varios casos a partir de un único caso.

Ordenar casos

Este cuadro de diálogo ordena los casos (las filas) del conjunto de datos activos basándose en los valores

de una o más variables de ordenación. Puede ordenar los casos en orden ascendente o descendente.

vSi selecciona más de una variable de ordenación, los casos se ordenarán por variable dentro de las

categorías de la variable anterior de la lista Ordenar por. Por ejemplo, si selecciona Sexo como la

primera variable de ordenación y Minoría como la segunda, los casos se ordenarán por minorías dentro

de cada categoría de sexo.

vLa secuencia de ordenación está basada en el orden definido de forma regional (y no tiene por qué ser

igual al orden numérico de los códigos de caracteres). El entorno local predeterminado es el entorno

local del sistema operativo. Puede controlar el entorno local con el ajuste Idioma de la pestaña General

del cuadro de diálogo Opciones (menú Edición).

Para ordenar casos

1. Elija en los menús:

Datos >Ordenar casos...

2. Seleccione una o más variables de ordenación.

También puede intentar lo siguiente:

Indexar el archivo guardado. Indexar las tablas de referencia puede mejorar el rendimiento al

fusionar archivos de datos con UNIÓN EN ESTRELLA.

Guardar el archivo ordenado. Puede guardar el archivo ordenado con la opción de guardar como

cifrado. El cifrado permite proteger la información confidencial guardada en el archivo. Una vez

cifrado, el archivo solo se puede abrir con la contraseña asignada al archivo.

Para guardar el archivo ordenado con cifrado:

3. Seleccione Guardar archivo con datos ordenados y pulse en Archivo.

4. Seleccione Cifrar archivo con contraseña en el cuadro de diálogo Guardar datos ordenados como.

5. Pulse en Guardar.

6. En el cuadro de diálogo Cifrar archivo, introduzca una contraseña y vuelva a introducirla en el

cuadro de texto Confirmar contraseña. Las contraseñas están limitadas a 10 caracteres y distinguen

entre mayúsculas y minúsculas.

Advertencia: si pierde las contraseñas, no podrá recuperarlas. Si se pierde la contraseña, no podrá abrir el

archivo.

Creación de contraseñas seguras

vUtilice ocho o más caracteres.

vIncluya números, símbolos e incluso signos de puntuación en su contraseña.

vEvite secuencias de números o caracteres como, por ejemplo, "123" y"abc", así como repeticiones; por

ejemplo, "111aaa".

vNo cree contraseñas que contengan información personal como, por ejemplo, fechas de cumpleaños o

apodos.

vCambie periódicamente la contraseña.

Nota: no se permite guardar los archivos cifrados en un IBM SPSS Collaboration and Deployment

Services Repository.

Nota: Los archivos de datos y los documentos de resultado cifrados no se pueden abrir en versiones de

IBM SPSS Statistics anteriores a la versión 21. Los archivos de sintaxis cifrados no se pueden abrir en

versiones anteriores a la versión 22.

Ordenar variables

Puede ordenar las variables del conjunto de datos activo en función de los valores de cualquiera de los

atributos de variable (por ejemplo, nombre de la variable, tipo de variable, tipo de datos, nivel de

medición), incluidos los atributos de variable personalizados.

vLos valores se pueden ordenar en orden ascendente o descendente.

vPuede guardar la variable original (ordenada previamente) en un atributo de variable personalizado.

vLa ordenación por valores de atributos de variable personalizados se limita a los atributos de variable

personalizados que están visibles actualmente en la Vista de variables.

Para obtener más información sobre los atributos de variable personalizados, consulte “Atributos

personalizados de variables” en la página 62.

Para ordenar variables

En la Vista de variables del Editor de datos:

1. Pulse con el botón derecho del ratón en el encabezado de columna Atributo y elija en el menú

emergente Ordenar de forma ascendente uOrdenar de forma descendente.

2. En los menús de la Vista de variables o Vista de datos, elija:

Datos >Ordenar variables

114 Guía del usuario de IBM SPSS Statistics 23 Core System

3. Seleccione el atributo que desea utilizar para ordenar variables.

4. Seleccione el orden de orden (ascendente o descendente).

vLa lista de atributos de variable coincide con los nombres de la columna de atributos representada en

la Vista de variables del Editor de datos.

vPuede guardar la variable original (ordenada previamente) en un atributo de variable personalizado.

Para cada variable, el valor del atributo es un valor entero que indica su posición antes de la

ordenación; de manera que al ordenar las variables en función del valor de dicho atributo

personalizado se puede restaurar su orden original.

Transponer

Transponer crea un archivo de datos nuevo en el que se transponen las filas y las columnas del archivo

de datos original de manera que los casos (las filas) se convierten en variables, y las variables (las

columnas) se convierten en casos. También crea automáticamente nombres de variable y presenta una

lista de dichos nombres.

vSe crea automáticamente una nueva variable de cadena, case_lbl, que contiene el nombre de variable

original.

vSi el conjunto de datos activo contiene una variable de identificación o de nombre con valores

exclusivos, podrá utilizarla como variable de nombre: sus valores se emplearán como nombres de

variable en el archivo de datos transpuesto. Si se trata de una variable numérica, los nombres de

variable comenzarán por la letra V, seguida de un valor numérico.

vLos valores perdidos del usuario se convierten en el valor perdido del sistema en el archivo de datos

transpuesto. Para conservar cualquiera de estos valores, se debe cambiar la definición de los valores

perdidos en la Vista de variables del Editor de datos.

Para transponer variables y casos

1. Elija en los menús:

Datos >Transponer...

2. Seleccione la variable o variables que desee transponer en casos.

Fusión de archivos de datos

Es posible unir los datos de dos archivos de dos maneras diferentes. Puede:

vFundir el conjunto de datos activo con otro conjunto de datos abierto o archivo de datos IBM SPSS

Statistics que contenga las mismas variables pero diferentes casos.

vFundir el conjunto de datos activo con otro conjunto de datos abierto o archivo de datos IBM SPSS

Statistics que contenga los mismos casos pero diferentes variables.

Para fundir archivos

1. Elija en los menús:

Datos >Fundir archivos

2. Seleccione Añadir casos oAñadir variables.

Añadir casos

Añadir casos fusiona el conjunto de datos activo con un segundo conjunto de datos o archivo de datos

IBM SPSS Statistics externo que contenga las mismas variables (columnas) pero diferentes casos (filas).

Por ejemplo, podría registrar la misma información de los clientes de dos zonas de venta diferentes y

conservar los datos de cada zona en archivos distintos. El segundo conjunto de datos puede ser un

archivo de datos IBM SPSS Statistics externo o un conjunto de datos disponible en la sesión actual.

Capítulo 9. Gestión y transformación de los archivos 115

Variables desemparejadas. Muestra las variables que se van a excluir del nuevo archivo de datos

fusionado. Las variables del conjunto de datos activo se identifican mediante un asterisco (*). Las

variables del otro conjunto de datos se identifican con un signo más (+). De forma predeterminada, la

lista contiene:

vLas variables de cualquiera de los archivos de datos que no coincidan con un nombre de variable del

otro archivo. Puede crear pares a partir de variables desemparejadas e incluirlos en el nuevo archivo

fusionado.

vLas variables definidas como datos numéricos en un archivo y como datos de cadena en el otro. Las

variables numéricas no pueden fusionarse con variables de cadena.

vVariables de cadena de longitud diferente. El ancho definido de una variable de cadena debe ser el

mismo en ambos archivos de datos.

Variables del nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo archivo de

datos fusionado. De forma predeterminada, la lista incluye todas las variables que coinciden en el

nombre y el tipo de datos (numéricos o de cadena).

vPuede eliminar de la lista las variables que no desee incluir en el archivo fusionado.

vLas variables desemparejadas incluidas en el archivo fusionado contendrán los datos perdidos para los

casos del archivo que no contiene esa variable.

Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de origen. Esta variable

toma un valor 0 para los casos del conjunto de datos activo y un valor 1 para los casos del archivo de

datos externo.

1. Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios conjuntos de datos

abiertos, convierta uno de los conjuntos de datos que desea fusionar en el conjunto de datos activo.

Los casos de este archivo aparecerán primero en el nuevo archivo de datos fusionado.

2. Elija en los menús:

Datos >Fundir archivos >Añadir casos...

3. Seleccione el conjunto de datos o el archivo de datos IBM SPSS Statistics que va a fusionar con el

conjunto de datos activo.

4. Elimine de la lista Variables del nuevo conjunto de datos activo cualquier variable que no desee

incluir.

5. Añada parejas de variables de la lista Variables desemparejadas que representen la misma información

registrada con nombres diferentes en los dos archivos. Por ejemplo, la fecha de nacimiento podría

tener el nombre de variable fechnac en un archivo y nacfech en el otro.

Para seleccionar una pareja de variables desemparejadas

1. Pulse en una de las variables en la lista Variables desemparejadas.

2. Mantenga pulsada la tecla Ctrl mientras selecciona la otra variable de la lista con el ratón (pulse al

mismo tiempo la tecla Ctrl y el botón izquierdo del ratón).

3. Pulse en Casar para desplazar el par de variables a la lista Variables del nuevo conjunto de datos

activo. (El nombre de variable del conjunto de datos activo se empleará como el nombre de variable

en el archivo fusionado.)

Añadir casos: cambiar nombre

Puede cambiar los nombres de las variables del conjunto de datos activo o de otro conjunto de datos

antes de desplazarlas desde la lista de variables desemparejadas a la lista de variables que se van a

incluir en el archivo de datos fusionado. Cambiar el nombre de las variables le permite:

vUtilizar el nombre de variable del otro conjunto de datos en lugar del nombre del conjunto de datos

activo para las parejas de variables.

vIncluir dos variables con el mismo nombre pero de diferentes tipos o longitudes de cadena. Por

ejemplo, para incluir la variable numérica sexo del conjunto de datos activo y la variable de cadena sexo

del otro conjunto de datos, primero se debe cambiar el nombre de una de ellas.

116 Guía del usuario de IBM SPSS Statistics 23 Core System

Añadir casos: información del diccionario

Toda información del diccionario (etiquetas de variable y de valor, valores perdidos del usuario, formatos

de presentación) existente en el conjunto de datos activo se aplicará al archivo de datos fusionado.

vSi alguna información del diccionario sobre una variable no está definida en el conjunto de datos

activo, se utilizará la información del diccionario del otro conjunto de datos.

vSi el conjunto de datos activo contiene cualquier etiqueta de valor definida o valores perdidos del

usuario para una variable, se ignorará cualquier otra etiqueta de valor o valor perdido del usuario para

esa variable en el otro conjunto de datos.

Fusión de más de dos orígenes de datos

Puede fusionar hasta 50 conjuntos de datos y/o archivos de datos con la sintaxis de comandos. Si desea

obtener información, consulte el comando ADD FILES en la referencia de sintaxis de comandos (Command

Syntax Reference) (disponible en el menú Ayuda).

Añadir variables

Añadir variables fusiona el conjunto de datos activo con otro conjunto de datos abierto o un archivo de

datos IBM SPSS Statistics que contenga los mismos casos (filas) pero diferentes variables (columnas). Por

ejemplo, es posible que desee fusionar un archivo de datos que contenga los resultados previos de la

prueba con otro que contenga los resultados posteriores.

vSi no está emparejando casos basándose en los valores de variables clave, el orden del archivo

determina cómo se emparejan los casos.

vSi se utilizan una o más variables clave para emparejar los casos e indica que los archivos ya están

ordenados, los dos conjuntos de datos deben seguir un orden ascendente de la variable o variables

clave.

vLos nombres de las variables del segundo archivo de datos que son duplicados de los del conjunto de

datos activo se excluyen de forma predeterminada, ya que Añadir variables supone que estas variables

contienen información duplicada.

Indicar origen del caso como variable. Indica, para cada caso, el archivo de datos de origen. Esta variable

toma un valor 0 para los casos del conjunto de datos activo y un valor 1 para los casos del archivo de

datos externo.

Variables excluidas. Muestra las variables que se van a excluir del nuevo archivo de datos fusionado. De

forma predeterminada, la lista contiene los nombres de variable de otro conjunto de datos que son

duplicados de los del conjunto de datos. Las variables del conjunto de datos activo se identifican

mediante un asterisco (*). Las variables del otro conjunto de datos se identifican con un signo más (+). Si

desea incluir en el archivo fusionado una variable excluida con un nombre duplicado, cámbiele el nombre

y añádala a la lista de variables que se van a incluir.

Nuevo conjunto de datos activo. Variables que se van a incluir en el nuevo conjunto de datos fusionado.

De forma predeterminada, se incluyen en la lista todos los nombres de variable exclusivos que existan en

ambos conjuntos de datos.

Variables clave. Puede utilizar variables clave para emparejar casos correctamente en los dos archivos.

Por ejemplo, puede haber una variable ID que identifique cada caso.

vSi uno de los archivos es una tabla de referencia, debe usar variables clave para emparejar casos en los

dos archivos. Los valores clave deben ser exclusivos en las tablas de referencia. Si hay varias claves, la

combinación de valores clave debe ser exclusiva.

vLas variables clave deben tener los mismos nombres en ambos conjuntos de datos. Utilice Cambiar

nombre para cambiar los nombres de variables clave si no coinciden.

El que no es conjunto de datos activo (o el conjunto de datos activo) es una tabla de claves. Una tabla

de claves, o tabla de referencia, es un archivo en el que los datos de cada “caso” se pueden aplicar a

varios casos del otro archivo de datos. Por ejemplo, si un archivo contiene información sobre los

Capítulo 9. Gestión y transformación de los archivos 117

diferentes miembros de la familia (como el sexo, la edad, la formación) y el otro contiene información

global (como los ingresos totales, el número de miembros o la ubicación), se puede utilizar el archivo

global como una tabla de referencia y aplicar los datos comunes de la familia a cada uno de sus

miembros en el archivo fusionado.

1. Abra al menos uno de los archivos de datos que desea fusionar. Si tiene varios conjuntos de datos

abiertos, convierta uno de los conjuntos de datos que desea fusionar en el conjunto de datos activo.

2. Elija en los menús:

Datos >Fundir archivos >Añadir variables...

3. Seleccione el conjunto de datos o el archivo de datos IBM SPSS Statistics que va a fusionar con el

conjunto de datos activo.

Para seleccionar variables clave

1. Seleccione las variables entre las variables del archivo externo (marcadas con el signo +) en la lista

Variables excluidas.

2. Seleccione Emparejar los casos en las variables clave para los archivos ordenados.

3. Añada las variables a la lista Variables clave.

Las variables clave deben existir en el conjunto de datos activo y en el otro conjunto de datos.

Añadir variables: cambiar nombre

Puede cambiar los nombres de las variables del conjunto de datos activo o del otro archivo de datos antes

de desplazarlas a la lista de variables que se van a incluir en el archivo de datos fusionado. Esto es

especialmente útil si desea incluir dos variables con el mismo nombre que contienen información

diferente en los dos archivos o si una variable clave tiene nombres diferentes en los dos archivos.

Fusión de más de dos orígenes de datos

Utilizando sintaxis de comandos, puede fusionar más de dos datos de archivos.

vUtilice EMPAREJAR ARCHIVOS para fusionar varios archivos que no contienen variables clave o varios

archivos ya ordenados con los valores de variables clave.

vUtilice UNIÓN EN ESTRELLA para fusionar varios archivos en los que hay un archivo de datos de caso y

varias tablas de referencia. No es necesario ordenar los archivos en función de los valores de variables

clave, y cada tabla de referencia puede utilizar una variable clave diferente.

Agregar datos

Agregar datos agrega grupos de casos en el conjunto de datos activo en casos individuales y crea un

archivo nuevo agregado o variables nuevas en el conjunto de datos activo que contiene los datos

agregados. Los casos se agregan en función del valor de cero o más variables de segmentación

(agrupación). Si no se han especificado variables de segmentación, el conjunto de datos completo es un

grupo de segmentación simple.

vSi crea un archivo de datos agregado nuevo, dicho archivo de datos nuevo contiene un caso para cada

grupo definido por las variables de segmentación. Por ejemplo, si hay una variable de segmentación

con dos valores, el archivo de datos nuevo contiene sólo dos casos. Si no se especifica una variable de

segmentación, el nuevo archivo de datos contendrá un caso.

vSi añade variables agregadas al conjunto de datos activo, no se agrega el archivo de datos. Cada caso

con los mismos valores de variables de segmentación recibe los mismos valores para las nuevas

variables agregadas. Por ejemplo, si sexo es la única variable de segmentación, todos los hombres

reciben el mismo valor para la variable agregada nueva que representa la edad media. Si no se

especifica una variable de segmentación, todos los casos recibirán el mismo valor para una nueva

variable agregada que representa una edad media.

Variables de segmentación. Los casos se agrupan en función de los valores de las variables de

segmentación. Cada combinación exclusiva de valores de variables de segmentación define un grupo. Al

118 Guía del usuario de IBM SPSS Statistics 23 Core System

crear un archivo de datos agregados nuevo, todas las variables de segmentación se guardan en el archivo

nuevo con sus nombres y la información del diccionario. Si se especifica la variable de segmentación,

puede ser tanto numérica como de cadena.

Variables agregadas. Las variables de origen se utilizan con funciones función de agregación para crear

variables agregadas nuevas. El nombre de la variable agregada viene seguido de una etiqueta de variable

opcional, el nombre de la función de agregación y el nombre de la variable de origen entre paréntesis.

Puede anular los nombres predeterminados de las variables agregadas con nuevos nombres de variable,

proporcionar etiquetas de variable descriptivas y cambiar las funciones empleadas para calcular los

valores de los datos agregados. También puede crear una variable que contenga el número de casos en

cada grupo de segmentación.

Para agregar un archivo de datos

1. Elija en los menús:

Datos >Agregar...

2. Puede seleccionar una o más variables de segmentación que definan cómo deben agruparse los casos

para crear datos agregados. Si no se han especificado variables de segmentación, el conjunto de datos

completo es un grupo de segmentación simple.

3. Seleccione una o varias variables para incluir.

4. Seleccione una función de agregación para cada variable agregada.

Almacenamiento de resultados agregados

Puede añadir variables agregadas al conjunto de datos activo o crear un archivo de datos agregados

nuevo.

vAñadir variables agregadas al conjunto de datos activo. Se añaden nuevas variables basadas en funciones

agregadas al conjunto de datos activo. El propio archivo de datos no se agrega. Cada caso con los

mismos valores de variables de segmentación recibe los mismos valores para las nuevas variables

agregadas.

vCrear un nuevo conjunto de datos que contenga únicamente las variables agregadas. Guarda datos agregados

en un nuevo conjunto de datos en la sesión actual. El conjunto de datos incluye las variables de

segmentación que definen los casos agregados y todas las variables de agregación definidas por las

funciones de agregación. No afecta al conjunto de datos activo.

vEscribir un nuevo archivo de datos que contenga sólo las variables agregadas. Guarda los datos agregados en

un archivo de datos externo. El archivo incluye las variables de segmentación que definen los casos

agregados y todas las variables agregadas definidas por las funciones de agregación. No afecta al

conjunto de datos activo.

Opciones de ordenación para archivos de datos grandes

En el caso de los archivos de datos muy grandes, puede resultar más eficiente agregar datos ordenados

previamente.

El archivo ya está ordenado según las variables de segmentación. Si los datos ya se han ordenados por los

valores de las variables de segmentación, e procedimiento se ejecuta ejecución más rápidamente y utiliza

menos memoria. Utilice esta opción con precaución.

vLos datos se deben ordenar por valores de variables de segmentación en el mismo orden que las

variables de segmentación especificadas para el procedimiento Agregar datos.

vSi va a añadir variables al conjunto de datos activo, seleccione sólo esta opción si los datos se han

ordenado mediante valores ascendentes de las variables de segmentación.

Capítulo 9. Gestión y transformación de los archivos 119

Ordenar archivo antes de agregarlo. En situaciones muy extrañas y con archivos de datos voluminosos,

puede ser necesario ordenar el archivo de datos por los valores de las variables de segmentación antes de

realizar la agregación. No se recomienda esta opción a menos que se presenten problemas de memoria

y/o rendimiento.

Agregar datos: Función de agregación

Este cuadro de diálogo permite especificar la función que se utilizará para calcular los valores de los

datos agregados para las variables seleccionadas en la lista Agregar variables, en el cuadro de diálogo

Agregar datos. Las funciones de agregación incluyen:

vFunciones de resumen para variables numéricas, incluyendo la media, la mediana, la desviación

estándar y la suma

vNúmero de casos, incluyendo los no ponderados, los ponderados, los no perdidos y los perdidos

vPorcentaje, fracción o recuento de los valores por encima o por debajo de un valor especificado

vPorcentaje, fracción o recuento de los valores dentro o fuera de un rango especificado

Agregar datos: Nombre y etiqueta de variable

Agregar datos asigna nombres de variable predeterminados a las variables agregadas al nuevo archivo de

datos. Este cuadro de diálogo le permite cambiar el nombre de variable de la variable seleccionada en la

lista Agregar variables y proporcionar una etiqueta de variable descriptiva. Consulte el tema “Nombres

de variable” en la página 56 para obtener más información.

Segmentar archivo

Segmentar archivo divide el archivo de datos en distintos grupos para el análisis basándose en los valores

de una o más variables de agrupación. Si selecciona varias variables de agrupación, los casos se

agruparán por variable dentro de las categorías de la variable anterior de la lista Grupos basados en. Por

ejemplo, si selecciona sexo como la primera variable de agrupación y minoría como la segunda, los casos

se agruparán por minorías dentro de cada categoría de sexo.

vEs posible especificar hasta ocho variables de agrupación.

vCada ocho bytes de una variable de cadena larga (variables de cadena que superan los ocho bytes)

cuenta como una variable hasta llegar al límite de ocho variables de agrupación.

vLos casos deben ordenarse según los valores de las variables de agrupación, en el mismo orden en el

que aparecen las variables en la lista Grupos basados en. Si el archivo de datos todavía no está

ordenado, seleccione Ordenar archivo según variables de agrupación.

Comparar los grupos. Los grupos de archivos segmentados se presentan juntos para poder compararlos.

Para las tablas dinámicas se crea una sola tabla y cada variable de segmentación de archivos puede

desplazarse entre las dimensiones de la tabla. En el caso de los gráficos se crea un gráfico diferente para

cada grupo de archivos segmentados y se muestran juntos en el Visor.

Organizar los resultados por grupos. Los resultados de cada procedimiento se muestran por separado

para cada grupo de archivos segmentados.

Para segmentar un archivo de datos para el análisis

1. Elija en los menús:

Datos >Segmentar archivo...

2. Seleccione Comparar los grupos uOrganizar los resultados por grupos.

3. Seleccione una o más variables de agrupación.

120 Guía del usuario de IBM SPSS Statistics 23 Core System

Seleccionar casos

Seleccionar casos proporciona varios métodos para seleccionar un subgrupo de casos basándose en

criterios que incluyen variables y expresiones complejas. También se puede seleccionar una muestra

aleatoria de casos. Los criterios usados para definir un subgrupo pueden incluir:

vValores y rangos de las variables

vRangos de fechas y horas

vNúmeros de caso (filas)

vExpresiones aritméticas

vExpresiones lógicas

vFunciones

Todos los casos. Desactiva el filtrado y utiliza todos los casos.

Si se satisface la condición. Utiliza una expresión condicional para seleccionar los casos. Si el resultado de la

expresión condicional es verdadero, se selecciona el caso. Si el resultado es falso o perdido, no se

selecciona el caso.

Muestra aleatoria de casos. Selecciona una muestra aleatoria basándose en un porcentaje aproximado o en

un número exacto de casos.

Basándose en el rango del tiempo o de los casos. Selecciona los casos basándose en un rango de los números

de caso o en un rango de las fechas/horas.

Usar variable de filtro. Utiliza como variable para el filtrado la variable numérica seleccionada del archivo

de datos. Se seleccionan los casos con cualquier valor distinto del 0 o del valor perdido para la variable

seleccionada.

Resultados

Esta sección controla el tratamiento de casos no seleccionados. Puede elegir una de las siguientes

alternativas para tratar los casos no seleccionados:

vDescartar casos no seleccionados. Los casos no seleccionados no se incluyen en el análisis, pero se

conservan en el conjunto de datos. Podrá utilizar los casos no seleccionados más adelante en la sesión,

si desactiva el filtrado. Si selecciona una muestra aleatoria o si selecciona los casos mediante una

expresión condicional, se generará una variable con el nombre filter_$ que tendrá el valor 1 para los

casos seleccionados y el valor 0 para los casos no seleccionados.

vCopiar casos seleccionados a un nuevo conjunto de datos. Los casos seleccionados se copiarán a un

nuevo conjunto de datos, lo que mantendrá inalterado el conjunto de datos original. Los casos no

seleccionados no se incluirán en el nuevo conjunto de datos y se mantendrán en su estado original en

el conjunto de datos original.

vEliminar casos no seleccionados. Los casos no seleccionados se eliminarán del conjunto de datos. Sólo

se pueden recuperar los casos eliminados saliendo del archivo sin guardar ningún cambio y abriéndolo

de nuevo. La eliminación de los casos será permanente si se guardan los cambios en el archivo de

datos.

Nota: Si elimina los casos no seleccionados y guarda el archivo, no será posible recuperar estos casos.

Para seleccionar un subconjunto de casos

1. Elija en los menús:

Datos >Seleccionar casos...

2. Seleccione uno de los métodos de selección de casos.

3. Especifique los criterios para la selección de casos.

Capítulo 9. Gestión y transformación de los archivos 121

Seleccionar casos: si

Este cuadro de diálogo permite seleccionar subconjuntos de casos utilizando expresiones condicionales.

Una expresión condicional devuelve un valor verdadero,falso operdido para cada caso.

vSi el resultado de una expresión condicional es verdadero, se incluirá el caso en el subconjunto

seleccionado.

vSi el resultado de una expresión condicional es falso operdido, no se incluirá el caso en el subconjunto

seleccionado.

vLa mayoría de las expresiones condicionales utilizan al menos uno de los seis operadores de relación

(<, >, <=, >=, =, y ~=) de la calculadora.

vLas expresiones condicionales pueden incluir nombres de variable, constantes, operadores aritméticos,

funciones numéricas (y de otros tipos), variables lógicas y operadores de relación.

Seleccionar casos: muestra aleatoria

Este cuadro de diálogo permite seleccionar una muestra aleatoria basada en un porcentaje aproximado o

en un número exacto de casos. El muestreo se realiza sin sustitución, de manera que el mismo caso no se

puede seleccionar más de una vez.

Aproximadamente. Genera una muestra aleatoria con el porcentaje aproximado de casos indicado. Dado

que esta rutina toma una decisión pseudo-aleatoria para cada caso, el porcentaje de casos seleccionados

sólo se puede aproximar al especificado. Cuantos más casos contenga el archivo de datos, más se acercará

el porcentaje de casos seleccionados al porcentaje especificado.

Exactamente. Un número de casos especificado por el usuario. También se debe especificar el número de

casos a partir de los cuales se generará la muestra. Este segundo número debe ser menor o igual que el

número total de casos presentes en el archivo de datos. Si lo excede, la muestra contendrá un número

menor de casos proporcional al número solicitado.

Seleccionar casos: rango

Este cuadro de diálogo selecciona los casos basándose en un rango de números de caso o en un rango de

fechas u horas.

vLos rangos de casos se basan en el número de fila que se muestra en el Editor de datos.

vLos rangos de fechas y horas sólo están disponibles para los datos de serie temporal con variables de

fecha definidas (menú Datos, Definir fechas).

Nota: si se filtran casos no seleccionados (en lugar de suprimirlos), la posterior ordenación del conjunto

de datos desactivará el filtro aplicado por este cuadro de diálogo.

ponderación de casos

Ponderar casos proporciona a los casos diferentes ponderaciones (mediante una réplica simulada) para el

análisis estadístico.

vLos valores de la variable de ponderación deben indicar el número de observaciones representadas por

casos únicos en el archivo de datos.

vLos casos con valores perdidos, negativos o cero para la variable de ponderación se excluyen del

análisis.

vLos valores fraccionarios son válidos y algunos procedimientos, como Frecuencias, Tablas cruzadas y

Tablas personalizadas, utilizan valores de ponderación fraccionarios. Sin embargo, la mayoría de los

procedimientos consideran la ponderación de variables una ponderación de réplica y simplemente

redondean las ponderaciones fraccionarias al número entero más cercano. Algunos procedimientos

ignoran por completo la variable de ponderación, y esta limitación se indica en la documentación

específica del procedimiento.

122 Guía del usuario de IBM SPSS Statistics 23 Core System

Si aplica una variable de ponderación, ésta seguirá vigente hasta que se seleccione otra o se desactive la

ponderación. Si guarda un archivo de datos ponderado, la información de ponderación se guardará con

el archivo. Puede desactivar la ponderación en cualquier momento, incluso después de haber guardado el

archivo de forma ponderada.

Ponderaciones en las tablas cruzadas. El procedimiento Tablas cruzadas cuenta con diversas opciones

para el tratamiento de ponderaciones de los casos.

Ponderaciones en los diagramas de dispersión y los histogramas. Los diagramas de dispersión y los

histogramas tienen una opción para activar y desactivar las ponderaciones de los casos, pero dicha

opción no afecta a los casos que tienen un valor negativo, un valor0ounvalor perdido para la variable

de ponderación. Estos casos permanecen excluidos del gráfico incluso si se desactiva la ponderación

desde el gráfico.

Para ponderar casos

1. Elija en los menús:

Datos >Ponderar casos...

2. Seleccione Ponderar casos mediante.

3. Seleccione una variable de frecuencia.

Los valores de la variable de frecuencia se utilizan como ponderaciones de los casos. Por ejemplo, un

caso con un valor 3 para la variable de frecuencia representará tres casos en el archivo de datos

ponderado.

Reestructuración de los datos

Utilice el Asistente de reestructuración de datos para reestructurar los datos de acuerdo con el

procedimiento que desee utilizar. El asistente sustituye el archivo actual con un archivo nuevo

reestructurado. El asistente puede:

vReestructurar variables seleccionadas en casos

vReestructurar casos seleccionados en variables

vTransponer todos los datos

Para reestructurar datos

1. Elija en los menús:

Datos >Reestructurar...

2. Seleccione el tipo de reestructuración que desea realizar.

3. Seleccione los datos que se van a reestructurar.

Si lo desea, puede:

vCrear variables de identificación, que permitirán rastrear un valor del nuevo archivo a partir de un

valor del archivo original

vOrdenar los datos antes de la reestructuración

vDefinir opciones para el nuevo archivo

vPegar la sintaxis de comandos en una ventana de sintaxis

Asistente de reestructuración de datos: seleccionar tipo

Utilice el Asistente de reestructuración de datos para reestructurar los datos. En el primer cuadro de

diálogo, seleccione el tipo de reestructuración que desea llevar a cabo.

Capítulo 9. Gestión y transformación de los archivos 123

vReestructurar variables seleccionadas en casos. Seleccione esta opción cuando disponga, en los datos,

de grupos de columnas relacionadas y desee que aparezcan en el nuevo archivo de datos como grupos

de filas. Si elige esta opción, el asistente mostrará los pasos para Variables a casos.

vReestructurar casos seleccionados en variables. Seleccione esta opción cuando disponga, en los datos,

de grupos de filas relacionadas y desee que aparezcan en el nuevo archivo de datos como grupos de

columnas. Si elige esta opción, el asistente mostrará los pasos para Casos a variables.

vTransponer todos los datos. Seleccione esta opción cuando desee transponer los datos. Todas las filas

se convertirán en columnas y todas las columnas en filas, en el nuevo archivo de datos. Esta opción

cierra el Asistente de reestructuración de datos y abre el cuadro de diálogo Transponer datos.

Opciones de reestructuración de los datos

Una variable contiene información que se desea analizar, por ejemplo, una medición o una puntuación.

Un caso es una observación, por ejemplo, un individuo. En una estructura de datos simple, cada variable

es una única columna de datos y cada caso es una única fila. De manera que, por ejemplo, si estuviera

midiendo las puntuaciones de un examen realizado a todos los alumnos de una clase, todos los valores

de las notas aparecerían en una única columna y habría una fila para cada alumno.

Cuando se analizan datos, a menudo se está analizando cómo varía una variable en función de cierta

condición. Dicha condición puede ser un tratamiento experimental específico, un grupo demográfico, un

momento en el tiempo u otra cosa. En el análisis de datos, a las condiciones de interés a menudo se las

denomina factores. Al analizar factores, se dispone de una estructura de datos compleja. Es posible que

haya información acerca de una variable en más de una columna de datos (por ejemplo, una columna

para cada nivel de un factor), o que haya información acerca de un caso en más de una fila (por ejemplo,

una fila para cada nivel de un factor). El Asistente de reestructuración de datos le ayuda a reestructurar

archivos con una estructura de datos compleja.

La estructura del archivo actual y la estructura que se desea en el nuevo archivo determinan las

elecciones que se deben seleccionar en el asistente.

¿Cómo están organizados los datos en el archivo actual? Es posible que los datos actuales estén

organizados de manera que los factores estén registrados en una variable diferente (como grupos de casos)

ocon la variable (como grupos de variables).

vGrupos de casos. ¿El archivo actual tiene registradas las variables y las condiciones en columnas

diferentes? Por ejemplo:

Tabla 10. Datos con variables y condiciones en columnas independientes

var factorial

En este ejemplo, las dos primeras filas son un grupo de casos porque están relacionadas. Contienen datos

para el mismo nivel del factor. En el análisis de datos de IBM SPSS Statistics, cuando los datos están

estructurados de esta manera, se hace referencia al factor como variable de agrupación.

vGrupos de columnas. ¿El archivo actual tiene registradas las variables y las condiciones en la misma

columna? Por ejemplo:

Tabla 11. Datos con variables y condiciones en la misma columna

var_1 var_2

124 Guía del usuario de IBM SPSS Statistics 23 Core System

Tabla 11. Datos con variables y condiciones en la misma columna (continuación)

var_1 var_2

En este ejemplo, las dos primeras columnas son un grupo de variables porque están relacionadas.

Contienen datos para la misma variable, var_1 para el nivel 1 del factor y var_2 para el nivel 2 del factor.

En el análisis de datos de IBM SPSS Statistics, si los datos se estructuran de esta manera, el factor se suele

denominar de medidas repetidas.

¿Cómo deben organizarse los datos en el archivo nuevo? Normalmente, la organización estará

determinada por el procedimiento que se vaya a utilizar para analizar los datos.

vProcedimientos que requieren grupos de casos. Los datos deberán estructurarse en grupos de casos

para realizar los análisis que requieran una variable de agrupación. Algunos ejemplos son: univariante,

multivariante ycomponentes de la varianza de los Modelos lineales generales; Modelos mixtos; Cubos

OLAP; y muestras independientes de las PruebasToPruebas no paramétricas. Si la estructura de datos

actual es de grupos de variables y desea realizar estos análisis, seleccione Reestructurar variables

seleccionadas en casos.

vProcedimientos que requieren grupos de variables. Los datos se deberán estructurar en grupos de

variables para analizar medidas repetidas. Algunos ejemplos son: medidas repetidas de los Modelos

lineales generales, análisis de covariables dependientes del tiempo del Análisis de regresión de Cox,

muestras relacionadas de las Pruebas T o muestras relacionadas de las Pruebas no paramétricas. Si la

estructura de datos actual es de grupos de casos y desea realizar estos análisis, seleccione

Reestructurar casos seleccionados en variables.

Ejemplo de variables a casos

En este ejemplo, las puntuaciones de las pruebas están registradas en columnas diferentes para cada

factor, AyB.

Tabla 12. Puntuaciones de pruebas registradas en columnas independientes para cada factor

puntuación_a puntuación_b

1014 864

684 636

810 638

Se desea realizar una prueba tpara muestras independientes. Se dispone de un grupo de columnas

compuesto por puntuación_a ypuntuación_b, pero no se dispone de la variable de agrupación que

requiere el procedimiento. Seleccione Reestructurar variables seleccionadas en casos en el Asistente de

reestructuración de datos, reestructure un grupo de variables en una nueva variable denominada

puntuación y cree un índice denominado grupo. El nuevo archivo de datos se muestra en la siguiente

imagen.

Tabla 13. Datos nuevos y reestructurados para variables a casos

grupo puntuación

PUNTUACIÓN_A 1014

PUNTUACIÓN_B 864

PUNTUACIÓN_A 684

PUNTUACIÓN_B 636

PUNTUACIÓN_A 810

PUNTUACIÓN_B 638

Capítulo 9. Gestión y transformación de los archivos 125

Cuando se ejecute la prueba tpara muestras independientes, podrá utilizar grupo como variable de

agrupación.

Ejemplo de casos a variables

En este ejemplo, las puntuaciones de las pruebas están registradas dos veces para cada sujeto, antes y

después de un tratamiento.

Tabla 14. Datos actuales para reestructurar casos a variables

id puntuación hora

1 1014 ant

1 864 des

2 684 ant

2 636 des

Se desea realizar una prueba tpara muestras relacionadas. La estructura de datos es de grupos de casos,

pero no se dispone de las medidas repetidas para las variables relacionadas que requiere el

procedimiento. Seleccione Reestructurar casos seleccionados en variables en el Asistente de

reestructuración de datos, utilice id para identificar los grupos de filas en los datos actuales y utilice

tiempo para crear el grupo de variables en el nuevo archivo.

Tabla 15. Datos nuevos y reestructurados para casos a variables

id des ant

1 864 1014

2 636 684

Cuando se ejecute la prueba tde muestras relacionadas, podrá utilizar ant ydes como el par de variables.

Asistente de reestructuración de datos (variables a casos): número de

grupos de variables

Nota: el asistente presenta este paso si se ha seleccionado reestructurar grupos de variables en filas.

En este paso, se debe elegir el número de grupos de variables del archivo actual que se desea

reestructurar en el nuevo archivo.

¿Cuántos grupos de variables hay en el archivo actual? Piense cuántos grupos de variables existen en

los datos actuales. Un grupo de columnas relacionadas, llamado grupo de variables, registra medidas

repetidas de la misma variable en distintas columnas. Por ejemplo, si en los datos actuales hay tres

columnas, c1,c2 yc3, que registran el contorno, entonces hay un grupo de variables. Si además hay otras

tres columnas, a1,a2 ya3, que registran la altura, entonces hay dos grupos de variables.

¿Cuántos grupos de variables debe haber en el archivo nuevo? Considere cuántos grupos de variables

desea que estén representados en el nuevo archivo de datos, teniendo en cuenta que no es necesario

reestructurar todos los grupos de variables en el nuevo archivo.

vUno. El asistente creará una única variable reestructurada en el nuevo archivo a partir de un grupo de

variables del archivo actual.

vMás de uno. El asistente creará varias variables reestructuradas en el nuevo archivo. El número que se

especifique afectará al siguiente paso, en el que el asistente creará de forma automática el número

especificado de nuevas variables.

126 Guía del usuario de IBM SPSS Statistics 23 Core System

Asistente de reestructuración de datos (variables a casos): seleccionar

variables

Nota: el asistente presenta este paso si se ha seleccionado reestructurar grupos de variables en filas.

En este paso, se debe proporcionar información sobre cómo se van a utilizar las variables del archivo

actual en el nuevo archivo. También se puede crear una variable que identifique las filas en el nuevo

archivo.

¿Cómo se deben identificar las nuevas filas? En el nuevo archivo de datos, puede crear una variable que

identifique la fila del archivo de datos actual que ha sido utilizada para crear un grupo de filas nuevo. El

identificador puede ser un número de caso secuencial o los valores de una variable. Utilice los controles

disponibles en el apartado Identificación de grupos de casos para definir la variable de identificación

utilizada en el nuevo archivo. Pulse en la casilla para cambiar el nombre de variable predeterminado y

para dotar a la variable de identificación de una etiqueta de variable descriptiva.

¿Qué se debe reestructurar en el nuevo archivo? En el paso anterior, se informo al asistente del número

de grupos de variables que se deseaba reestructurar. El asistente creó una nueva variable para cada

grupo. Los valores para el grupo de variables aparecerán en dicha variable en el nuevo archivo. Utilice

los controles en Variables que se van a transponer para definir la variable reestructurada en el nuevo

archivo.

Para especificar una variable reestructurada

1. Ponga las variables que componen el grupo de variables que desea transformar en la lista Variables

que se van a transponer. Todas las variables del grupo deberán ser del mismo tipo (numéricas o de

cadena).

Se puede incluir la misma variable más de una vez en el grupo de variables (las variables se copian de la

lista origen de variables en lugar de moverlas); los valores se repetirán en el nuevo archivo.

Para especificar varias variables reestructuradas

1. Seleccione la primera variable objetivo que desea definir de la lista desplegable Variable objetivo.

2. Ponga las variables que componen el grupo de variables que desea transformar en la lista Variables

que se van a transponer. Todas las variables del grupo deberán ser del mismo tipo (numéricas o de

cadena). Puede incluir la misma variable más de una vez en el grupo de variables. (Las variables se

copian de la lista origen de variables en lugar de moverlas, y los valores se repetirán en el nuevo

archivo.)

3. Seleccione la siguiente variable objetivo que desea definir y repita el proceso de selección de variables

para todas las variables de destino disponibles.

vAunque puede incluir la misma variable más de una vez en el mismo grupo de variables de destino,

no puede incluir la misma variable en más de un grupo de variables de destino.

vCada lista de grupos de variables de destino debe contener el mismo número de variables. (Las

variables que aparecen más de una vez se incluyen en el recuento).

vEl número de grupos de variables de destino está determinado por el número de grupos de variables

especificados en el paso anterior. Aquí puede cambiar los nombres de las variables predeterminados,

pero deberá volver al paso anterior para cambiar el número de grupos de variables que se van a

reestructurar.

vDebe definir los grupos de variables (seleccionando variables de la lista de origen) para todas las

variables de destino disponibles antes de poder pasar al siguiente paso.

¿Qué se debe copiar en el nuevo archivo? En el nuevo archivo se pueden copiar variables que no se han

reestructurado. Sus valores se propagarán en las nuevas filas. Desplace las variables que desea copiar en

el nuevo archivo en la lista Variables fijas.

Capítulo 9. Gestión y transformación de los archivos 127

Asistente de reestructuración de datos (variables a casos): crear

variables de índice

Nota: el asistente presenta este paso si se ha seleccionado reestructurar grupos de variables en filas.

En este paso, se debe decidir si se crean variables de índice. Un índice es una nueva variable que

identifica de forma secuencial un grupo de filas en función de la variable original a partir de la cual se

creó la nueva fila.

¿Cuántas variables de índice debe haber en el archivo nuevo? Las variables de índice se pueden utilizar

como variables de agrupación en los procedimientos. En la mayoría de los casos, es suficiente una única

variable de índice; no obstante, si los grupos de variables del archivo actual reflejan varios niveles de

factor, puede ser conveniente utilizar varios índices.

vUno. El asistente creará una única variable de índice.

vMás de uno. El asistente creará varios índices y deberá introducir el número de índices que desea

crear. El número especificado afectará al siguiente paso, en el que el asistente crea de forma automática

el número especificado de índices.

vNinguno. Seleccione esta opción si no desea crear variables de índice en el nuevo archivo.

Ejemplo de un índice para variables a casos

En los datos actuales, hay un grupo de variables, denominado contorno, y un factor, el tiempo. El contorno

se ha medido en tres ocasiones y se ha registrado en c1,c2 yc3.

Tabla 16. Datos actuales para un índice

el asunto c1 c2 c3

1 6,7 4,3 5,7

2 7,1 5,9 5,6

Se va a reestructurar el grupo de variables en una única variable, contorno, y se va a crear un único índice

numérico. Los nuevos datos se muestran en la siguiente tabla.

Tabla 17. Datos nuevos y reestructurados con un índice

el asunto índice anchura

1 1 6,7

1 2 4,3

1 3 5,7

2 1 7,1

2 2 5,9

2 3 5,6

El Índice comienza por1yseincrementa por cada variable del grupo. Vuelve a comenzar cada vez que se

encuentra una fila en el archivo original. Ahora se puede utilizar índice en procedimientos que requieran

una variable de agrupación.

Ejemplo de dos índices para variables a casos

Cuando un grupo de variables registra más de un factor, se puede crear más de un índice; no obstante, se

deben organizar los datos actuales de forma que los niveles del primer factor sean un índice primario

dentro del cual varían los niveles de los siguientes factores. En los datos actuales, hay un grupo de

variables, denominado contorno, y dos factores, AyB. Los datos se organizan de manera que los niveles

de factor Bvarían dentro de los niveles de factor A.

128 Guía del usuario de IBM SPSS Statistics 23 Core System

Tabla 18. Datos actuales para dos índices

el asunto w_a1b1 w_a1b2 w_a2b1 w_a2b2

1 5,5 6,4 5,8 5,9

2 7,4 7,1 5,6 6,7

Se va a reestructurar el grupo de variables en una única variable, contorno, y se van a crear dos índices.

Los nuevos datos se muestran en la siguiente tabla.

Tabla 19. Datos nuevos reestructurados con los dos índices

el asunto índice_a índice_b anchura

1 1 1 5,5

1 1 2 6,4

1 2 1 5,8

1 2 2 5,9

2 1 1 7,4

2 1 2 7,1

2 2 1 5,6

2 2 2 6,7

Asistente de reestructuración de datos (variables a casos): crear una

variable de índice

Nota: el asistente presenta este paso si se ha seleccionado reestructurar grupos de variables en filas y crear

una variable de índices.

En este paso, se debe decidir los valores que se desean para la variable de índice. Los valores pueden ser

números secuenciales o los nombres de las variables en un grupo de variables original. También puede

especificar un nombre y una etiqueta para la nueva variable de índice.

Consulte el tema “Ejemplo de un índice para variables a casos” en la página 128 para obtener más

información.

vNúmeros secuenciales. El asistente asignará de forma automática números secuenciales como valores

índice.

vNombres de variables. El asistente utilizará los nombres del grupo de variables seleccionado como

valores índice. Seleccione un grupo de variables de la lista.

vNombres y etiquetas. Pulse en una casilla para cambiar el nombre de variable predeterminado y

proporcionar una etiqueta de variable descriptiva para la variable de índice.

Asistente de reestructuración de datos (variables a casos): crear

varias variables de índice

Nota: el asistente presenta este paso si se ha seleccionado reestructurar grupos de variables en filas y crear

varias variables de índice.

En este paso, se debe especificar el número de niveles para cada variable de índice. También puede

especificar un nombre y una etiqueta para la nueva variable de índice.

Consulte el tema “Ejemplo de dos índices para variables a casos” en la página 128 para obtener más

información.

Capítulo 9. Gestión y transformación de los archivos 129

¿Cuántos niveles hay registrados en el archivo actual? Calcule los niveles de factor que hay registrados

en los datos actuales. Un nivel define un grupo de casos que experimentan las mismas condiciones. Si

hay varios factores, los datos actuales se deben organizar de manera que los niveles del primer factor

sean un índice primario dentro del cual varían los niveles de los siguientes factores.

¿Cuántos niveles debe haber en el archivo nuevo? Introduzca el número de niveles para cada índice.

Los valores para varias variables de índice son siempre números secuenciales. Los valores comienzan en

1 y se incrementan con cada nivel. El primer índice se incrementa más despacio y el último más deprisa.

Número total de niveles combinados. No se puede crear más niveles de los que existen en los datos

actuales. Como los datos reestructurados contendrán una fila por cada combinación de tratamientos, el

asistente realizará una comprobación del número de niveles que se crean. Comparará el producto de los

niveles creados con el número de variables del grupo de variables. Deben coincidir.

Nombres y etiquetas. Pulse en una casilla para cambiar el nombre de variable predeterminado y

proporcionar una etiqueta de variable descriptiva para las variables de índice.

Asistente de reestructuración de datos (variables a casos): opciones

Nota: el asistente presenta este paso si se ha seleccionado reestructurar grupos de variables en filas.

En este paso, se deben especificar las opciones para el nuevo archivo reestructurado.

¿Desea eliminar las variables no seleccionadas? En el paso de selección de variables (paso 3), se

seleccionaron los grupos de variables que se iban a reestructurar, las variables que se iban a copiar y una

variable de identificación de los datos actuales. Los datos de las variables seleccionadas aparecerán en el

nuevo archivo. Si hay más variables en los datos actuales, puede elegir descartarlas o conservarlas.

¿Desea conservar los datos perdidos? El asistente comprueba cada nueva fila potencial en busca de

valores nulos. Un valor nulo es un valor en blanco o perdido del sistema. Se puede elegir entre conservar

o descartar las filas que contienen sólo valores nulos.

¿Desea crear una variable de recuento? El asistente puede crear una variable de recuento en el nuevo

archivo. Dicha variable contiene el número de nuevas filas generadas por una fila de los datos actuales.

Una variable de recuento puede ser de gran utilidad si decide descartar del nuevo archivo los valores

nulos, ya que esto conlleva la generación de un número distinto de nuevas filas por una fila dada de los

datos actuales. Pulse en una casilla para cambiar el nombre de variable predeterminado y proporcionar

una etiqueta de variable descriptiva para la variable de recuento.

Asistente de reestructuración de datos (casos a variables): seleccionar

variables

Nota: el asistente presenta este paso si se ha seleccionado reestructurar grupos de casos en columnas.

En este paso, se debe proporcionar información sobre cómo se van a utilizar las variables del archivo

actual en el nuevo archivo.

¿Qué identifica los grupos de casos en los datos actuales? Un grupo de casos es un grupo de filas

relacionadas porque miden la misma unidad de observación, por ejemplo, un individuo o una institución.

El asistente necesita conocer cuáles son las variables del archivo actual que identifican los grupos de

casos para que se pueda consolidar cada grupo en una única fila del nuevo archivo. Desplace las

variables que identifican grupos de casos en el archivo actual a la lista de Variables de identificación. Las

variables que se utilizan para segmentar el archivo de datos actual se utilizan de forma automática para

identificar los grupos de casos. Cada vez que se encuentra una nueva combinación de valores de

identificación, el asistente creará una nueva fila, de manera que los casos del archivo actual deberán

130 Guía del usuario de IBM SPSS Statistics 23 Core System

ordenarse en función de los valores de las variables de identificación, en el mismo orden en el que

aparecen las variables en la lista Variables de identificación. Si el archivo de datos actual no está aún

ordenado, podrá hacerlo en el siguiente paso.

¿Cómo deben crearse los nuevos grupos de variables en el archivo nuevo? En los datos originales, una

variable aparece en una única columna. En el nuevo archivo de datos, dicha variable aparecerá en varias

columnas. Las variables de índice son variables existentes en los datos actuales que el asistente deberá

utilizar para crear las nuevas columnas. Los datos reestructurados contendrán una nueva variable por

cada valor exclusivo contenido en dichas columnas. Desplace a la lista Variables de índice las variables

que se deben utilizar para formar los nuevos grupos de variables. Cuando el asistente ofrezca opciones,

también puede elegir ordenar las nuevas columnas por el índice.

¿Qué sucede con las demás columnas? El asistente decide de forma automática lo que hay que hacer con

las variables que quedan en la lista Archivo actual. Comprueba cada variable para ver si los valores de

los datos varían dentro de un grupo de casos. Si hay alguna variación, el asistente reestructurará los

valores en un grupo de variables en el nuevo archivo. Si no la hay, el asistente copiará los valores en el

nuevo archivo. Al determinar si una variable varía en un grupo, los valores perdidos del usuario se

consideran valores válidos, pero los valores perdidos del sistema no. Si un grupo contiene un valor

válido o perdido del usuario más el valor perdido del sistema, se considera una variable que no varía en

el grupo y el asistente copiará los valores en el nuevo archivo.

Asistente de reestructuración de datos (casos a variables): ordenar

datos

Nota: El asistente presenta este paso si se ha seleccionado reestructurar grupos de casos en columnas.

En este paso, debe decidir si se ordena el archivo actual antes de reestructurarlo. Cada vez que el

asistente se encuentra una nueva combinación de valores de identificación, se crea una nueva fila, por lo

tanto, es importante que los datos estén ordenados por las variables que identifican los grupos de casos.

¿Cómo están ordenadas las filas en el archivo actual? Tenga en cuenta la ordenación de los datos

actuales y cuáles son las variables que se están utilizando para identificar grupos de casos (especificadas

en el paso anterior).

vSí. El asistente ordenará de forma automática los datos actuales en función de la variable de

identificación, con el mismo orden en el que aparecen las variables en la lista Variables de

identificación en el paso anterior. Seleccione esta opción cuando los datos no estén ordenados en

función de las variables de identificación o cuando no esté seguro. Esta opción requiere una lectura

adicional de los datos, pero garantiza que las filas estén correctamente ordenadas antes de la

reestructuración.

vNo. El asistente no ordenará los datos actuales. Seleccione esta opción cuando esté seguro de que los

datos actuales están ordenados en función de las variables que identifican los grupos de casos.

Asistente de reestructuración de datos (casos a variables): opciones

Nota: El asistente presenta este paso si se ha seleccionado reestructurar grupos de casos en columnas.

En este paso, se deben especificar las opciones para el nuevo archivo reestructurado.

¿Cómo deben ordenarse los nuevos grupos de variables en el archivo nuevo?

vPor variable. El asistente agrupa juntas las nuevas variables creadas a partir de una variable original.

vPor índice. El asistente agrupa las variables en función de los valores de las variables de índice.

Ejemplo. Las variables que se van a reestructurar son wyh, y el índice es mes:

w, h, mes

Capítulo 9. Gestión y transformación de los archivos 131

La agrupación por variable dará como resultado:

w.ene, w.feb, h.ene

La agrupación por índice dará como resultado:

w.ene, h.ene, w.feb

¿Desea crear una variable de recuento? El asistente puede crear una variable de recuento en el nuevo

archivo. Dicha variable contendrá el número de filas de los datos actuales que se utilizaron para crear

una fila en el nuevo archivo de datos.

¿Desea crear variables indicadoras? El asistente puede utilizar las variables de índice para crear

variables indicadoras en el nuevo archivo de datos. Creará una nueva variable por cada valor exclusivo

de la variable de índice. Las variables indicadoras indican la presencia o ausencia de un valor para un

caso. Una variable indicadora toma el valor 1 si el caso tiene un valor; en caso contrario, vale 0.

Ejemplo. La variable de índice es producto. Registra los productos que ha comprado un cliente. Los datos

originales son:

Tabla 20. Todos los productos en una única variable (columna)

cliente producto

1 pollo

1 huevos

2 huevos

3 pollo

La creación de una variable indicadora da como resultado una nueva variable para cada valor exclusivo

de producto. Los datos reestructurados son:

Tabla 21. Una variable indicadora distinta para cada tipo de producto

cliente indpollo indhuevos

11 1

20 1

31 0

En este ejemplo, se pueden utilizar los datos reestructurados para obtener recuentos de frecuencias de los

productos que compran los clientes.

Asistente de reestructuración de datos: finalizar

Este es el paso final del Asistente de reestructuración de datos. Debe decidir qué hacer con las

especificaciones.

vReestructurar los datos ahora. El asistente creará el nuevo archivo de datos reestructurado. Seleccione

esta opción si desea reemplazar el archivo actual inmediatamente.

Nota: Si los datos originales están ponderados, los nuevos datos también lo estarán, a menos que la

variable utilizada como ponderación se reestructure o se elimine del nuevo archivo.

vPegar la sintaxis. El asistente pegará la sintaxis que ha generado en una ventana de sintaxis.

Seleccione esta opción si no está preparado para reemplazar el archivo actual, si desea modificar la

sintaxis o si desea guardarla para utilizarla en el futuro.

132 Guía del usuario de IBM SPSS Statistics 23 Core System

Capítulo 10. Trabajo con resultados

Trabajo con resultados

Cuando ejecute un procedimiento, los resultados se mostrarán en una ventana llamada Visor. Desde esta

ventana puede desplazarse con facilidad a los resultados que desee ver. También puede modificar los

resultados y crear un documento que contenga exactamente los resultados que desee.

Visor

Los resultados se muestran en el Visor. Puede utilizar el Visor para:

vExaminar los resultados

vMostrar u ocultar tablas y gráficos seleccionados

vCambiar el orden de presentación de los resultados moviendo los elementos seleccionados

vMover elementos entre el Visor y otras aplicaciones

El Visor se divide en dos paneles:

vEl panel izquierdo contiene una vista de titulares de los contenidos.

vEl panel derecho contiene tablas estadísticas, gráficos y resultados de texto.

Puede pulsar en un elemento de los titulares para dirigirse directamente a la tabla o al gráfico

correspondiente. Puede pulsar y arrastrar el borde derecho del panel de titulares para cambiar la anchura

del mismo.

Mostrar y ocultar resultados

En el Visor, puede mostrar y ocultar de forma selectiva las tablas o los resultados individuales de todo un

procedimiento. Este proceso resulta de utilidad cuando desea reducir la cantidad de resultados visibles en

el panel de contenidos.

Para ocultar tablas y gráficos

1. En el panel de titulares del Visor, pulse dos veces en el icono de libro del elemento.

2. Pulse en el elemento para seleccionarlo.

3. Elija en los menús:

Ver >Ocultar

4. Pulse en el icono de libro cerrado (Ocultar) de la barra de herramientas de titulares.

El icono de libro abierto (Mostrar) se convierte en el icono activo, indicando que el elemento no está

oculto.

Para ocultar los resultados de un procedimiento

1. Pulse en el cuadro situado a la izquierda del nombre del procedimiento en el panel de titulares.

Se ocultarán todos los resultados del procedimiento y se contraerá la presentación de titulares.

Desplazamiento, eliminación y copia de resultados

Los resultados se pueden reorganizar copiando, moviendo o eliminando un elemento o un grupo de

elementos.

133

Para desplazar resultados en el Visor

1. Seleccione los elementos en el panel de titulares o de contenido.

2. Arrastre y coloque los elementos seleccionados en una ubicación diferente.

Para eliminar resultados en el Visor

1. Seleccione los elementos en el panel de titulares o de contenido.

2. Pulse la tecla Supr.

3. Elija en los menús:

Editar >Eliminar

Cambio de la alineación inicial

De forma predeterminada, todos los resultados están alineados inicialmente a la izquierda. Para cambiar

la alineación inicial de los nuevos elementos de los resultados:

1. Elija en los menús:

Editar >Opciones

2. Pulse en la pestaña Visor.

3. En el grupo Estado inicial de los resultados, seleccione el tipo de elemento (por ejemplo, tabla

dinámica, gráfico o resultados de texto).

4. Seleccione la opción de alineación que desee.

Cambio de la alineación de los elementos de resultados

1. En el panel de titulares o de contenido, seleccione los elementos que desea alinear.

2. Elija en los menús:

Formato >Alinear a la izquierda

Formato >Centrar

Formato >Alinear a la derecha

Titulares del visor

El panel de titulares proporciona una tabla de contenidos del documento del Visor. Utilice este panel para

navegar por los resultados y controlar su presentación. La mayoría de las acciones en dicho panel tienen

su efecto correspondiente en el panel de contenidos.

vSi se selecciona un elemento en el panel de titulares, también se mostrará el elemento correspondiente

en el panel de contenidos.

vSi se mueve un elemento en el panel de titulares, también se moverá el elemento correspondiente en el

panel de contenidos.

vSi se contrae la vista de titulares, se ocultarán los resultados de todos los elementos en los niveles

contraídos.

Control de la presentación de los titulares. Para controlar la presentación de titulares, puede:

vExpandir y contraer la presentación de titulares

vCambiar el nivel de los titulares para los elementos seleccionados

vCambiar el tamaño de los elementos en la presentación de titulares

vCambiar la fuente utilizada en la presentación de titulares

134 Guía del usuario de IBM SPSS Statistics 23 Core System

Para expandir y contraer la vista de titulares

1. Pulse en el cuadro situado a la izquierda del elemento de los titulares que desee contraer o expandir.

2. Pulse en el elemento de los titulares.

3. Elija en los menús:

Ver >Contraer

Ver >Expandir

Para cambiar el nivel de titulares

1. Pulse en el elemento del panel de titulares.

2. Pulse en la flecha izquierda de la barra de herramientas de titulares para ascender el elemento (mueva

el elemento hacia la izquierda).

Pulse en la flecha derecha de la barra de herramientas de titulares para degradar el elemento (mueva

el elemento hacia la derecha).

3. Elija en los menús:

Editar >Titular >Ascender

Editar >Titular >Degradar

El cambio del nivel de titulares es particularmente útil después de mover elementos en el nivel de

titulares. El desplazamiento de elementos puede cambiar el nivel de titulares de los elementos y puede

utilizar los botones de flecha izquierda y derecha de la barra de herramientas de los titulares para

restaurar el nivel de titulares original.

Para cambiar el tamaño de elementos de los titulares

1. Elija en los menús:

Ver >Tamaño de los titulares

2. Seleccione el tamaño de los titulares (Pequeño,Mediano oGrande).

Para cambiar la fuente de los titulares

1. Elija en los menús:

Ver >Fuente de los titulares...

2. Seleccione una fuente.

Adición de elementos al Visor

En el Visor puede añadir elementos tales como títulos, nuevo texto, gráficos o material de otras

aplicaciones.

Para añadir un título o texto

Pueden añadirse al Visor elementos de texto que no estén conectados a una tablaoaungráfico.

1. Pulse en la tabla, en el gráfico o en el otro objeto que precederá al título o al texto.

2. Elija en los menús:

Insertar >Nuevo título

Insertar >Nuevo texto

3. Pulse dos veces en el nuevo objeto.

Capítulo 10. Trabajo con resultados 135

4. Escriba el texto.

Para añadir un archivo de texto

1. En el panel de titulares o en el panel de contenidos del Visor, pulse en la tabla, en el gráfico o en otro

objeto que vaya a preceder al texto.

2. Elija en los menús:

Insertar >Archivo de texto...

3. Seleccione un archivo de texto.

Para editar el texto, pulse en él dos veces.

Pegado de objetos en el Visor

Es posible pegar objetos de otras aplicaciones en el Visor. Puede utilizar Pegar debajo o Pegado especial.

Cualquiera de estos tipos de pegado coloca el nuevo objeto después del objeto actualmente seleccionado

en el Visor. Utilice Pegado especial cuando desee seleccionar el formato del objeto pegado.

Búsqueda y sustitución de información en el Visor

1. Para buscar o reemplazar información en el Visor, elija en los menús:

Editar >Buscar

Editar >Reemplazar

Puede utilizar la función Buscar y reemplazar para:

vBuscar en todo un documento o únicamente en los elementos seleccionados.

vBuscar hacia abajo o hacia arriba, desde la ubicación actual.

vBuscar en ambos paneles o restringir la búsqueda al panel de contenido o de titulares.

vBuscar elementos ocultos, incluidos los elementos ocultos del panel de contenido (por ejemplo, las

tablas Notas, que están ocultas de forma predeterminada) y las filas y columnas ocultas de las tablas

dinámicas.

vRestringir los criterios de búsqueda a coincidencias que distingan entre mayúsculas y minúsculas.

vRestringir los criterios de búsqueda de las tablas dinámicas a coincidencias del contenido completo de

las casillas.

vRestringir los criterios de búsqueda en las tablas dinámicas sólo a marcadores de pie de página. Esta

opción no está disponible si la selección en el Visor incluye cualquier elemento distinto a tablas

dinámicas.

Elementos ocultos y capas de la tabla dinámica

vLas capas situadas por debajo de la capa visible actual de una tabla dinámica multidimensional no se

consideran ocultas y se incluirán en el área de búsqueda aunque no incluyan los elementos ocultos en

la búsqueda.

vLos elementos ocultos incluyen elementos ocultos del panel de contenido (elementos con iconos de

libro cerrado en el panel de titulares o incluidos dentro de bloques plegados del panel) y filas y

columnas de las tablas dinámicas ocultas de forma predeterminada (por ejemplo, las filas y columnas

vacías) o manualmente mediante la edición de la tabla y posterior selección de que se desea ocultar

determinadas filas y columnas. Los elementos ocultos sólo se incluirán en la búsqueda si selecciona de

forma explícita Incluir elementos ocultos.

vEn ambos casos, se mostrarán los elementos ocultos o no visibles que contengan el texto o valor de

búsqueda, pero a continuación volverán a su estado original.

Búsqueda de un rango de valores en tablas dinámicas

136 Guía del usuario de IBM SPSS Statistics 23 Core System

Para buscar valores dentro de un rango especificado de valores en tablas dinámicas:

1. Active una tabla dinámica o seleccione una o más tablas dinámicas en el Visor. Asegúrese de que sólo

selecciona tablas dinámicas. Si selecciona cualquier otro objeto, la opción Rango no estará disponible.

2. Elija en los menús:

Editar >Buscar

3. Pulse en la pestaña Rango.

4. Seleccione el tipo de rango: Entre, Mayor que o igual a o Menor que o igual a.

5. Seleccione el valor o valores que definen el rango.

vSi ambos valores contienen caracteres no numéricos, se tratan como cadenas.

vSi ambos valores son números, sólo se buscan valores numéricos.

vNo puede utilizar la pestaña Rango para reemplazar valores.

Esta característica no está disponible en tablas de versiones anteriores. Consulte el tema “Tablas de

versiones anteriores” en la página 164 para obtener más información.

Cierre de elementos de resultado

Puede cerrar todos los elementos de resultado actualmente abiertos que se habían abierto desde una

ventana de visor particular.

1. Seleccione la ventana de visor que desea.

2. Desde los menús, elija:

Ventana >Cerrar elementos de resultado

Pegado de resultados en otras aplicaciones

Los objetos de resultados pueden copiarse y pegarse en otras aplicaciones, como puede ser un procesador

de textos o una hoja de cálculo. Puede pegar los resultados de diversas formas. Según la aplicación de

destino y los objetos de resultado seleccionados, pueden estar disponibles todos o algunos de los

siguientes formatos:

Metaarchivo. Formato de metaarchivo WMF y EMF. Estos formatos sólo están disponibles en los sistemas

operativos Windows.

RTF (formato de texto enriquecido). Pueden copiarse y pegarse múltiples objetos seleccionados,

resultados de texto y tablas dinámicas en formato RTF. Para tablas dinámicas, en la mayoría de las

aplicaciones esto significa que las tablas se pegan como tablas que pueden editarse posteriormente en la

otra aplicación. Las tablas dinámicas que sean demasiado anchas para la anchura del documento se

acotarán, se reducirán para ajustarse a la anchura del documento o se dejarán sin cambios, dependiendo

de la configuración de las opciones de la tabla dinámica. Consulte el tema “Opciones de tabla dinámica”

en la página 225 para obtener más información.

Nota: es posible que Microsoft Word no muestre correctamente las tablas muy anchas.

Imagen. Formatos de imagen JPG y PNG.

BIFF. Las tablas dinámicas y el resultado de texto pueden pegarse en una hoja de cálculo en formato

BIFF. Los números de las tablas dinámicas retienen precisión numérica. Este formato sólo está disponible

en los sistemas operativos Windows.

Texto. Las tablas dinámicas y el resultado de texto pueden copiarse y pegarse como texto. Este proceso

puede ser útil en aplicaciones como el correo electrónico, donde sólo se puede aceptar o transmitir texto.

Capítulo 10. Trabajo con resultados 137

Si la aplicación de destino admite varios de los formatos disponibles, es posible que tenga un elemento

de menú Pegado especial que le permita seleccionar el formato o que muestre de forma automática una

lista de los formatos disponibles.

Copia y pegado de múltiples objetos de resultado

Se aplican las siguientes limitaciones cuando se pegan múltiples objetos de resultado en otras

aplicaciones:

vFormato RTF. En la mayoría de las aplicaciones, las tablas dinámicas se pegan como tablas que

pueden modificarse en esa aplicación. Los gráficos, los árboles y las vistas de modelo se pegan como

imágenes.

vFormatos de metaarchivos y de imagen. Todos los objetos de resultado seleccionados se pegan como

un único objeto en la otra aplicación.

vFormato BIFF. Los gráficos, árboles y vistas de modelo están excluidos.

También puede utilizar “Exportación de resultados” en la página 139 para exportar múltiples objetos de

resultado en otras aplicaciones/formatos.

Copiar especial

Cuando se copian y se pegan grandes cantidades de resultados, particularmente en tablas dinámicas muy

grandes, puede mejorar la velocidad de la operación utilizando Edición > Copiar especial para limitar el

número de formatos copiados al portapapeles.

También puede guardar los formatos seleccionados como el conjunto predeterminado de formatos para

copiar al portapapeles. Este ajuste se guardará entre sesiones.

Resultado interactivo

Los objetos de resultado interactivo contienen varios objetos de resultado relacionados. La selección en un

objeto puede cambiar lo que se visualiza o resalta en el otro objeto. Por ejemplo, seleccionar una fila en

una tabla podría resaltar un área en un mapa o mostrar un gráfico para una categoría diferente.

Los objetos de resultado interactivo no soportan las funciones de edición como, por ejemplo, cambiar

texto, colores, fuentes o bordes de tabla. Los objetos individuales se pueden copiar del objeto interactivo

al visor. Las tablas copias del resultado interactivo se pueden editar en el editor de tablas dinámicas.

Copia de objetos de resultado interactivo

Archivo>Copiar en el visor copia objetos de resultado individuales en la ventana del Visor.

vLas opciones disponibles dependen del contenido del resultado interactivo.

vGráfico yMapa crean objetos de gráfico.

vTabla crea una tabla dinámica que se puede editar en el editor de tablas dinámicas.

vInstantánea crea una imagen de la vista actual.

vModelo crea una copia del objeto de resultado interactivo actual.

Editar>Copiar objeto copia objetos de resultado individuales en el portapapeles.

vPegar el objeto copiado en el visor es equivalente a Archivo>Copiar en el visor.

vPegar el objeto en otro aplicación pega el objeto como una imagen.

138 Guía del usuario de IBM SPSS Statistics 23 Core System

Acercar y desplazar

Para los mapas, puede utilizar Ver>Acercar para acercar la vista del mapa. En una vista de mapa

acercada, puede utilizar Ver>Desplazar para mover la vista.

Valores de impresión

Archivo>Valores de impresión controla cómo se imprimen los objetos interactivos.

vImprimir vista visible únicamente. Imprime solo la vista que se visualiza actualmente. Esta opción es

el valor predeterminado.

vImprimir todas las vistas. Imprime todas las vistas incluidas en el resultado interactivo.

vLa opción seleccionada también determina la acción predeterminada para exportar el objeto de

resultado.

Información relacionada:

“Exportación de resultados”

Resultado interactivo

“Cierre de elementos de resultado” en la página 137

Exportación de resultados

La opción Exportar resultados guardar los resultados del Visor en formato HTML, texto, Word/RTF,

Excel, PowerPoint (requiere PowerPoint 97 o posterior) y PDF. Los gráficos se pueden exportar también

en varios formatos de gráficos distintos.

Nota: la exportación a PowerPoint sólo está disponible en los sistemas operativos Windows y no está

disponible con la versión para estudiantes.

Exportar el resultado

1. Active la ventana del Visor (pulse en cualquier punto de la ventana).

2. Elija en los menús:

Archivo >Exportar...

3. Especifique un nombre de archivo (o prefijo para los gráficos) y seleccione un formato de exportación.

Objetos para exportar. Permite exportar todos los objetos del Visor, todos los objetos visibles o sólo los

objetos seleccionados.

Tipo de documento. Las opciones disponibles son:

vWord/RTF. Las tablas dinámicas se exportan como tablas de Word con todos los atributos de formato

intactos (por ejemplo, bordes de casillas, estilos de fuente y colores de fondo). Los resultados de texto

se exportan en formato RTF. Los gráficos, diagramas de árbol y vistas de modelo se incluyen en

formato PNG. Tenga en cuenta que Microsoft Word es posible que no muestre correctamente las tablas

extremadamente anchas.

vExcel. Las filas, columnas y casillas de la tabla dinámica se exportan como filas, columnas y casillas

Excel, con todos los atributos de formato intactos (por ejemplo, bordes de casillas, estilos de fuente y

colores de fondo). Los resultados de texto se exportan con todos los atributos de fuente intactos. Cada

línea del resultado de texto es un fila en el archivo Excel, con todo el contenido de la línea en una sola

casilla. Los gráficos, diagramas de árbol y vistas de modelo se incluyen en formato PNG. Los

resultados se pueden exportar como Excel 97-2004 oExcel 2007 y posteriores.

vHTML. Las tablas dinámicas se exportan como tablas HTML. Los resultados de texto se exportan como

formato previo de HTML. Los gráficos, diagramas de árbol y vistas de modelo están incluidos en el

documento con el formato seleccionado. Es necesario un navegador compatible con HTML 5 para ver

el resultado que se exporta en formato HTML.

Capítulo 10. Trabajo con resultados 139

vInforme web. Un informe web es un documento interactivo compatible con la mayor parte de los

navegadores. Muchas de las características interactivas de las tablas dinámicas disponibles en el visor

también están disponibles en los informes web. También puede exportar un informe web como IBM

Cognos Active Report.

vFormato de documento portátil. Todos los resultados es exportan como aparecen en la vista previa de

impresión, con todos los atributos de formato intactos.

vArchivo de PowerPoint. Las tablas dinámicas se exportan como tablas de Word y se incrustan en

diapositivas independientes en el archivo de PowerPoint (una diapositiva por cada tabla dinámica).

Todos los atributos de formato de la tabla dinámica se conservan (por ejemplo, bordes de la casilla,

estilos de fuente y colores de fondo). Los gráficos, diagramas de árbol y vistas de modelo se exportan

en formato TIFF. No se incluyen los resultados de texto.

la exportación a PowerPoint sólo está disponible en los sistemas operativos Windows.

vTexto. Entre los formatos de resultados de texto se incluyen texto sin formato, UTF-8 y UTF-16. Las

tablas dinámicas se pueden exportar en formato separado por tabuladores o por espacios. Todos los

resultados de texto se exportan en formato separado por espacios. Para los gráficos, diagramas de árbol

y vistas de modelo, se inserta una línea en el archivo de texto para cada gráfico, que indica el nombre

del archivo de la imagen.

vNinguno (solo gráficos). Los formatos de exportación disponibles son: EPS, JPEG, TIFF, PNG y BMP.

En los sistemas operativos Windows, también está disponible el formato EMF (metarchivo mejorado).

Abrir el contenido de la carpeta. Abre la carpeta que contiene los archivos que se crean durante la

exportación.

Sistema de gestión de resultados. También puede exportar automáticamente todos los resultados o los

tipos especificados por usuario de resultado como archivos de datos de formato Word, Excel, PDF,

HTML, texto o IBM SPSS Statistics. Consulte Capítulo 22, “Sistema de gestión de resultados”, en la

página 267 si desea obtener más información.

Opciones de HTML

Exportar HTML requiere un navegador compatible con HTML 5. Las siguientes opciones están

disponibles para la exportación de resultados en formato HTML:

Capas en tablas dinámicas. De forma predeterminada, la inclusión o exclusión de las capas de una tabla

dinámica está controlada por las propiedades de la tabla de cada tabla dinámica. Puede anular este ajuste

e incluir todas las capas o excluir todas excepto la capa visible en ese momento. Consulte el tema

“Propiedades de tabla: impresión” en la página 159 para obtener más información.

Exportar tablas con capas como interactivas. Las tablas con capas se muestran tal y como aparecen en el

visor y puede cambiar interactivamente la capa visualizada en el navegador. Si esta opción no está

seleccionada, cada capa de la tabla se visualiza como una tabla separada.

Tablas como HTML. Controla la información de estilo que se incluye en tablas de pivote exportadas.

vExportar con estilos y anchos de columna fijados. Se conservan toda la información de estilo de tabla

dinámica (estilos de fuente, colores de fondo, etc.) y anchos de columna.

vExportar sin estilos. Las tablas dinámicas se convierten en tablas HTML predeterminadas. No se

conservan los atributos de estilo. El ancho de columna se determina automáticamente.

Incluir notas y textos al pie. Controla la inclusión o exclusión de todas las notas y textos al pie de la

tabla dinámica.

Vistas de modelos. De manera predeterminada, la inclusión o exclusión de vistas de modelos está

controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas o

140 Guía del usuario de IBM SPSS Statistics 23 Core System

excluirlas todas excepto la vista visible en ese momento. Consulte el tema “Propiedades de modelo” en la

página 166 para obtener más información. (Nota: todas las vistas de modelos, incluyendo las tablas, se

exportan como gráficos).

Nota: para HTML, también es posible controlar el formato de archivo de imagen de los gráficos

exportados. Consulte el tema “Opciones de formato de gráficos” en la página 145 para obtener más

información.

Para configurar las opciones de exportación de HTML

1. Seleccione HTML como formato de exportación.

2. Pulse en Cambiar opciones.

Opciones de informes web

Un informe web es un documento interactivo compatible con la mayor parte de los navegadores. Muchas

de las características interactivas de las tablas dinámicas disponibles en el visor también están disponibles

en los informes web.

Título de informe. El título que se muestra en la cabecera del informe. De forma predeterminada, se

utiliza el nombre de archivo. Puede especificar un título personalizado para que se utilice en lugar del

nombre de archivo.

Formato. Existen dos opciones para el formato de informe:

vInforme web SPSS (HTML 5). Este formato requiere un navegador que sea compatible con HTML 5.

vCognos Active Report (mht). Este formato requiere un navegador que dé soporte a archivos de

formato MHT o la aplicación Cognos Active Report.

Excluir objetos. Puede excluir del informe los tipos de objeto seleccionados:

vTexto. Los objetos de texto que no son registros. Esta opción incluye objetos de texto que contienen

información sobre el conjunto de datos activo.

vRegistros. Los objetos de texto que contienen una lista de la sintaxis de comando que se ha ejecutado.

Los elementos del registro también incluyen avisos y mensajes de error que se han encontrados los

comandos que no generan ningún resultado del visor.

vTablas de notas. El resultado de los procedimientos estadísticos y de gráficos incluye una tabla de

notas. Esta tabla contiene información sobre el conjunto de da tos que se ha utilizado, los valores que

faltan y la sintaxis del comando que se ha utilizado para ejecutar el procedimiento.

vMensajes de aviso y de error. Mensajes de avisos y error de procedimientos estadísticos y gráficos.

Redefinir el estilo de las tablas y gráficos para que coincidan con el informe web. Esta opción se aplica

al estilo de informe web estándar en todas las tablas y los gráficos. Este valor altera temporalmente las

fuentes, los colores u otros estilos en el resultado tal como se visualiza en el visor. No puede modificar el

estilo del informe web estándar.

Conexión de servidor web. Puede incluir la ubicación del URL de uno o más servidores de aplicaciones

que ejecutan el IBM SPSS Statistics Web Report Application Server. El servidor de aplicaciones web

proporciona características a las tablas dinámicas, para editar gráficos y guardar informes web

modificados.

vSeleccione Utilizar para cada servidor de aplicaciones que desee incluir en el informe web.

vSi un informe web contiene una especificación de URL, el informe web se conecta al servidor de

aplicaciones para proporcionar características adicionales de edición.

vSi especifica varias URL, el informe web intenta conectarse a cada servidor en el orden en el cual se

han especificado.

Capítulo 10. Trabajo con resultados 141

El IBM SPSS Statistics Web Report Application Server se puede descargar desde http://www.ibm.com/

developerworks/spssdevcentral.

Opciones de Word/RTF

Las siguientes opciones están disponibles para la exportación de resultados en formato Word:

Capas en tablas dinámicas. De forma predeterminada, la inclusión o exclusión de las capas de una tabla

dinámica está controlada por las propiedades de la tabla de cada tabla dinámica. Puede anular este ajuste

e incluir todas las capas o excluir todas excepto la capa visible en ese momento. Consulte el tema

“Propiedades de tabla: impresión” en la página 159 para obtener más información.

Tablas dinámicas anchas. Controla la gestión de tablas que sean demasiado anchas para el ancho del

documento definido. De manera predeterminada, la tabla se ajusta hasta alcanzar el tamaño correcto. La

tabla se divide en secciones y las etiquetas de fila se repiten en cada sección de la tabla. También puede

reducir tablas anchas o no hacer ningún cambio en las tablas anchas y dejar que se extiendan más allá del

ancho del documento definido.

Conservar puntos de corte. Si ha definido puntos de corte, estas configuraciones se mantendrán en las

tablas de Word.

Incluir notas y textos al pie. Controla la inclusión o exclusión de todas las notas y textos al pie de la

tabla dinámica.

Vistas de modelos. De manera predeterminada, la inclusión o exclusión de vistas de modelos está

controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas o

excluirlas todas excepto la vista visible en ese momento. Consulte el tema “Propiedades de modelo” en la

página 166 para obtener más información. (Nota: todas las vistas de modelos, incluyendo las tablas, se

exportan como gráficos).

Configuración de página para exportación. Esto abre un cuadro de diálogo donde puede definir el

tamaño y los márgenes de página del documento exportado. El ancho del documento utilizado para

determinar el ajuste o la reducción de escala es el ancho de página menos los márgenes izquierdo y

derecho.

Para configurar las opciones de exportación de HTML

1. Seleccione Word/RTF como formato de exportación.

2. Pulse en Cambiar opciones.

Opciones de Excel

Las siguientes opciones están disponibles para la exportación de resultados en formato Excel:

Cree una hoja o libro de trabajo o modifique una hoja de trabajo existente. De manera predeterminada,

se crea un nuevo libro de trabajo. Si ya existe un archivo con el nombre especificado, se sobrescribirá. Si

selecciona la opción de creación de una hoja de trabajo y ya existe otra con el nombre especificado en el

archivo indicado, se sobrescribirá. Si selecciona la opción de modificación de una hoja de trabajo

existente, también deberá especificar el nombre de la hoja de trabajo. (Esto es opcional para la creación de

una hoja de trabajo.) Los nombres de hojas de trabajo no pueden superar los 31 caracteres y no pueden

contener barras inclinadas normales o invertidas, corchetes, símbolos de interrogación o asteriscos.

Al exportar a Excel 97-2004, si modifica una hoja de trabajo existente, los gráficos, las vistas de modelo y

los diagramas de árbol no se incluyen en los resultados exportados.

Ubicación en la hoja de trabajo. Controla la ubicación de los resultados exportados dentro de la hoja de

trabajo. De manera predeterminada, los resultados exportados se añadirán detrás de la última columna

142 Guía del usuario de IBM SPSS Statistics 23 Core System

con contenido, empezando en la primera fila, sin modificar el contenido existente. Éste es un buen

momento para añadir nuevas columnas a una hoja de trabajo existente. La adición de resultados

exportados detrás de la última fila es una buena opción para añadir nuevas filas a una hoja de trabajo

existente. La adición de resultados exportados empezando desde una ubicación de casilla específica

sobrescribirá el contenido existente en la zona donde se añadan los resultados exportados.

Capas en tablas dinámicas. De forma predeterminada, la inclusión o exclusión de las capas de una tabla

dinámica está controlada por las propiedades de la tabla de cada tabla dinámica. Puede anular este ajuste

e incluir todas las capas o excluir todas excepto la capa visible en ese momento. Consulte el tema

“Propiedades de tabla: impresión” en la página 159 para obtener más información.

Incluir notas y textos al pie. Controla la inclusión o exclusión de todas las notas y textos al pie de la

tabla dinámica.

Vistas de modelos. De manera predeterminada, la inclusión o exclusión de vistas de modelos está

controlada por las propiedades de cada modelo. Puede anular este ajuste e incluir todas las vistas o

excluirlas todas excepto la vista visible en ese momento. Consulte el tema “Propiedades de modelo” en la

página 166 para obtener más información. (Nota: todas las vistas de modelos, incluyendo las tablas, se

exportan como gráficos).

Para configurar las opciones de exportación de Excel

1. Seleccione Excel como formato de exportación.

2. Pulse en Cambiar opciones.

Opciones de PowerPoint

Las siguientes opciones están disponibles para PowerPoint: