domingo, 24 de enero de 2010

Pautas para realizar una Hoja de Vida

Buscando un poco algunas consideraciones para tener en cuenta en la hoja de vida podemos decir lo siguiente

Su CV debe ser:

  • Perfecto en la ortografía y la sintaxis.

  • Impecablemente limpio.

  • Bien organizado.

  • Comentar los hechos esenciales acerca de su experiencia profesional.

  • Que hable este documento de por qué Ud. es un posible empleado a contratar.

  • Sea lo más breve posible y consigne su información en un documento no máximo de dos a tres páginas.

  • Mantenga la CV libre de todas las abreviaturas, y cualquier tipo de notación corta.

Cuando buscamos un trabajo debemos intentar dar a conocer nuestras habilidades acorde al empleo que estamos buscando. Por ejemplo es si se está buscando un Investigador, un Docente o un Colaborador. El primero de estos busca una persona que haya realizado investigación y pueda sustentarla, el segundo empleo es un docente que pueda impartir conocimiento en una clase y el tercero de estos es una persona con habilidades específicas para ciertos puestos en los cuales colaboren con estas habilidades.

Referencias


Tips on Preparing a Vita

Como elaborar y presentar un Curriculum Viate

Ver también: Hoja de vida en $\LaTeX$, Pautas para afrontar una entrevista

Hoja de Vida con LaTeX

Tratando de mejorar mi hoja de vida en \(\LaTeX\) la cual estaba en el formato currvita encontré un paquete que hoy quiero compartir con ustedes. El formato moderncv, con el cual he mejorado mi hoja de vida o como también se le conoce Curriculum Vitae (CV). La manera de utilizarlo es mediante la instrucción en el preambulo así

\documentclass{ moderncv}

con este comando podrán comenzar a escribir su CV, lo interesante es que con este pueden tener diferentes estilos y temas por ejemplo si cargamos los siguientes comandos
 
\moderncvtheme{casual}

podrán obtener un CV como el que utilizo, la documentación pertinente la pueden encontrar en el siguiente link (dar click aquí), algunos ejemplos que encontré navegando para que lo miren

Ejemplo, ejemplo, código.

Espero les interese.

domingo, 17 de enero de 2010

Tiempo de lectura rapida y compresión de archivos con R

A quien no le ha pasado que la lectura y manipulación de documentos en archivo plano es muy tediosa para el trabajo con el software R,  no solo porque la lectura de estos es demasiado lenta sino también porque los documento en estos formatos es muy pesada y ocupa demasiado espacio en el disco. Esto es muy común y David Smith en su blog Revolutions nos comenta de una característica para la versión 2.10 de R para solucionar este tipo de problemas.

Básicamente consiste en comprimir el archivo plano en formatos como gzip, bzip2, xvz (me llamaba la atención es que la plataforma Linux comprime estos archivos en esos formatos bajo unos comandos de consola, mientras que Windows se debe considerar un software, una buena opción es 7-zip) esto ahorra espacio en el disco duro y a su vez tiempo de lectura en el software R. Esto es una gran ayuda y una mejora sustancial del mismo R. Aunque no es la única opción disponible, también se puede conseguir comprimir estos archivos planos con dos formatos especiales que los hace el mismo R, uno de ellos es el formato del software Stata cuya extensión es .dta (R permite después de una lectura de un archivo exportar los mismos en formato .dta) y el otro formato es el mismo que utiliza el R, los archivos con extensión .Rdata.

Veamos cómo se consigue esto

Generemos un base de por lo menos 100 preguntas y 100000 registros  y guardemos este archivo en un directorio de trabajo

X <- matrix(rnorm(1e7), ncol=100)
write.table(X, file="c:/X.txt", sep=",", row.names=FALSE, col.names=FALSE)
file.info("c:/X.txt")$size
[1] 181915087

Notamos que el documento pesa casi 182 Megas. Ahora teniendo esto comprobemos el tiempo de lectura de este archivo de texto con dos comandos básicos de lectura de archivos el read.table y scan

system.time(read.table("c:/X.txt"))
user  system elapsed
107.07    0.38  108.11
system.time(scan("c:/X.txt", sep=",", what=rep(0,10)))
Read 10000000 items
user  system elapsed
34.47    0.37   34.95

Observemos que el tiempo de lectura de este archivo con el read.table es casi 107 segundos mientras que el scan lee el archivo en casi 35 segundos.

Pasemos ahora a guardar esta base en el formato .Rdata y el formato .dta de Stata con R (para realizar esto último tenemos que llamar la librería foregin la cual permite leer y escribir bases en diferentes formatos)

save(X,file="c:/X.Rdata")
file.info("c:/X.Rdata")$size
[1] 76854086
library(foreign)
write.dta(as.data.frame(X), file = "c:/X.dta", version = 7)
file.info("c:/X.dta")$size
[1] 80016316

Notamos que el archivo en formato .Rdata pesa casi 77 Megas y con el formato .dta pesa casi 80 Megas. Miremos los tiempos de lectura de estos últimos formatos

system.time(load("c:/X.Rdata"))
user  system elapsed
3.55    0.13    3.71
system.time(read.dta("c:/X.dta"))
user  system elapsed
2.09    0.12    2.28

Vemos un tiempo de lectura de casi 4 segundos con el formato .Rdata mientras el formato .dta se lee en 2 segundos.

Notese que que se ha reducido considerablemente el peso del archivo ASCII en casi un 55% del tamaño original con los formatos .Rdata y .dta y ni hablar de los tiempos de lectura mejoran demasiado. Ahora como un archivo no se lee una sola vez los tiempos de lectura no tienen que ser los mismos. Vamos a probar este pequeño detalle mediante un ejercicio de simulación comparando el tiempo de lectura promedio de archivos que contengan entre 1000, 10000, 100000, 1000000 y 10000000 observaciones. Los resultados se pueden observar en el siguiente gráfico


Conclusión los formatos comprimidos en .Rdata y .dta son más rápidos  de leer que los archivos sin comprimir. Cabe resaltar que David Smith hace pruebas similares con los formatos .gzip, .txt y .dta, llegando a la conclusión que el formato .dta mejora sustancialmente en el tiempo de lectura mientras que el archivo comprimido .gzip no lo hace. Una observación más que note es que los archivos en formato .Rdata por trabajar en el mismo R son mucho más livianos con datos reales.

Ver tambien: Nuevo año 2010 con R, R-commander, software R, sobre Matlab y R.

jueves, 7 de enero de 2010

Matemáticas del Cubo de Rubik



Hace poco hice un post acerca del cubo de rubik, hoy encontré un libro muy interesante Adventures in Group Theory: Rubik's Cube, Merlin's Machine, and Other Mathematical Toys de David Joyner que deja muy en claro que si se puede "matematizar" este juguete.

David Joyner describe en su libro que de manera "practica" los temas de matemáticas como la teoría de grupos y el álgebra abstracta llevadas a la vida, simplicidad y practicidad de estos mismos a través de los juguetes. Joyner utiliza permutaciones del rompecabezas como el cubo de Rubik y sus variantes, el Masterball Rainbow, la máquina de Merlín, el Pyraminx, y el Skewb para explicar los conceptos básicos introductorios del álgebra y teoría de grupos. Los temas tratados son los gráficos de Cayley, simetrías, isomorfismos, los productos de corona, los grupos libres, y los campos finitos de la teoría de grupos, así como matrices algebraicas, la combinatoria y permutaciones.

Recomiendo esta lectura y también las matemáticas del Cubo de Rubik.

Aquí hay mucho que estudiar, espero salgan algunos trabajos de grado con esta idea. Les dejo algunas variantes interesantes del cubo del Rubik.

Teorema del Límite Central


En cierta ocasión leyendo un poco el blog de Jhon Cook, cree un post en mi blog anterior en el nos habla de los inicios y la mejor manera de explicar el Teorema del Límite Central que dice lo siguiente

Teorema del Límite Central (TCL)


Si \(X_1,X_2,\ldots,X_n\) es una muestra aleatoria de una población con valor esperado \(\mu\) y varianza \(\sigma^2\) finitas, considerando la variable aleatoria
\[Z_n=\frac{\overline{X}_n-\mu}{\frac{\sigma}{\sqrt{n}}}\]

entonces la sucesión de variables aleatorias \(Z_n\) converge en distribución a una variable aleatoria con distribución Normal Estándar.

Es decir
\[\frac{\sqrt{n}(\overline{X}-\mu)}{\sigma}\xrightarrow{d}Z\sim N(0,1).\]

Esto se debe en gran parte a la convergencia en distribución de la suma de un número creciente de variables aleatorias al modelo Gaussiano. Algunos teoremas derivados de este son los siguientes

Teorema 2


Si \(X_1,X_2,\ldots,X_n\) es una muestra aleatoria de una población con distribución Normal de valor esperado $\mu$ y varianza \(\sigma^2\), entonces
\[{\overline X}\sim N \left(\mu,\frac{\sigma^2}{n}\right).\]

Teorema 3


Si \(X_1,X_2,\ldots,X_n\) es una sucesión de variables aleatorias independientes tales que \(X_i\sim N(\mu_i,\sigma^2_i)\), entonces
\[U=\sum\limits_{i=1}^n\left(\dfrac{X_i-\mu_i}{\sigma_i}\right)^2\sim \chi^2_{(n)}.\]

Corolario


Cuando una sucesión de variables aleatorias constituyen una muestra aleatoria de una población con distribución Normal, de valor esperado \(\mu\) y varianza \(\sigma^2\), entonces
\[U=\sum\limits_{i=1}^n\left(\dfrac{X_i-\mu}{\sigma}\right)^2\sim \chi^2_{(n)}.\]

Teorema 4


Si \(X_1,X_2,\ldots,X_n\) es una muestra aleatoria de una población Normal de valor esperado \(\mu\) y varianza \(\sigma^2\), entonces
\[\sum\limits_{i=1}^n\left(\frac{X_i-\overline{X}_n}{\sigma}\right)^2=\frac{(n-1)S^2_n}{\sigma^2}\sim \chi^2_{(n-1)}.\]

En un curso de probabilidad se podría comenzar su estudio de la siguiente manera
  1. Definir la distribución normal.
  2. Probar un caso especial del teorema central del límite.
  3. Presente la aproximación normal a la binomial, como corolario.

En este orden de ideas se puede también probar el TCL mediante un ejemplo práctico en R construyendo un conjunto de números aleatorios con cierta distribución y aplicando el teorema 2, por ejemplo veamos el siguiente código

U<-matrix(runif(10000),ncol=10)
medias<-apply(U,1,mean)
hist(medias,main="Distribución de la Media",freq=F,border=8,ylab="Frecuencias Relativas")
lines(density(medias),col=2,lty=2,lwd=2)


Su resultado es el siguiente el gráfico de este post.

Por último Jhon Cook nos habla de tres formas diferentes del TLC.

miércoles, 6 de enero de 2010

Pautas para afrontar entrevista

Fuente: http://s.wsj.net/public/resources/images/OB-FE874_MANAGE_D_20100104171517.jpg

Las entrevistas siempre nos han hecho una batalla sin cuartel para quienes ingresan en el mundo laboral y es que afrontar una entrevista ha venido adquiriendo este matiz, anteriormente recomendé unas pautas para afrontar entrevistas para postgrados, hoy leyendo el siguiente artículo del Wall Street Jornual nos dan a entender que las entrevistas se ganan por la capacidad de manejar los nervios, y son los "detalles" los que hacen la diferencia. Los nervios causa que hagas cosas que normalmente no se harían cuando se tiene que competir contra muchas personas para un trabajo y los detalles que tienen para algunos menos importancia para otros son los más importantes. Algunas recomendaciones para enfrentar estas entrevistas son las siguientes

  • Su atuendo. Como decía anteriormente, no he visto que para ir a una entrevista se tenga que ir con bermudas y camisa playera. Es mejor llegar con un buen atuendo mostrando seriedad que se va adquirir con este trabajo.

  • Su etiqueta a la hora de la comida. Ahora es muy común que las entrevistas se hagan en las horas de los almuerzos, que pasaría si se llegara primero de manera impuntual, segundo pidiendo el plato más caro de la carta y tercer ni hablar de los modales, humm.

  • Su tacto. Una de las preguntas muy comunes en las entrevistas es cuando estaría dispuesto a comenzar el trabajo?.  Hay dos momentos antes y después de esa pregunta y las respuestas deben estar acorde. Antes de tener una oferta asegurada no sería bueno decirle al entrevistador que no podría comenzar la otra semana, eso solo significa una cosa, no sirves para el trabajo. Si la oferta está asegurada y tienes la vacante en tus manos es el mejor momento para negociar tu inicio de trabajo.

  • Evite la sudoración excesiva. Aunque no tiene sentido todo se puede evitar planeado con tiempo su llegada, utilizando técnicas de relajación y mucha tranquilidad a la hora de tener esta entrevista.

  • Su comportamiento. Bueno en esto si cabe destacar que somos de diferentes comportamientos. Algunos coléricos, apasionados, extrovertidos, expresivos. Cabe manejar todos esos comportamiento durante la entrevista, imagínese cuando ya tenemos la vacante nos da un arrebato y revoleteemos como gallinas y sin querer tumbamos una taza de café que tenia nuestro futuro jefe, humm.

Bueno espero les haya agradado las lecciones, no sin antes resaltar que lean el artículo en el link anterior. Muchos éxitos.

La Estadística es una herramienta para la vida

Hace poco escribí un post en el cual hacia énfasis de la importancia de enseñar estadística según Arthur Benjamin , en el tuve una discusión bien interesante con un amigo matemático quien obviamente defendía su postura, hoy encuentro un artículo muy interesante en el New York Times un poco antiguo pero rescato los sin fin de ejemplos que en él se comentan y nos da entender que la estadística es una herramienta para la vida más que enseñar matemáticas. El artículo comenta lo siguiente
Muchos educadores queremos que todos los estudiantes de secundaria estén preparados para el cálculo. Eso significa tomar el álgebra en el octavo grado y que abarca la geometría, álgebra y trigonometría por el tercer año. Esto deja muy poco espacio para el estudio de la estadística y probabilidad. Sin embargo, los estudiantes necesitan la base en el análisis de datos. La presión al cálculo universal se ha basado en la falsa creencia de que los colegios y puestos de trabajo futuro lo exigen. Sin embargo, aunque el cálculo es importante para los estudiantes universitarios que se especializan en la ciencia y para la literatura científica de otras, sólo algunos trabajos, más en los campos técnico, realmente no se utiliza. A nivel nacional, los educadores que reconocen este desequilibrio están tratando de tener más temas estadísticos en el currículo de matemáticas. En un lugar está sucediendo es Malcolm Bridge Middle School, a unos 60 kilómetros al este de Atlanta. Allí, Jamie Parker ha enseñado recientemente alumnos de séptimo grado para hacer gráficas llamadas diagramas de dispersión en la que una "X" representa la relación entre dos aspectos del tamaño corporal de los estudiantes habían medido. Los gráficos muestran la muñeca de cada estudiante y la circunferencia del tobillo, o la altura y extensión de los brazos, o la longitud de dedo índice y el dedo más largo.

Más adelante dice
La interpretación de estos requiere de habilidades no sólo diferente de la matemática convencional, sino una forma diferente de pensar. La geometría y la prueba de la preocupación de cálculo. La Estadística describir la incertidumbre. Este cambio de orientación hace que sea difícil de ampliar las estadísticas de la instrucción. Los profesores de matemáticas a menudo se resisten a ponerlo en el curso regular de estudios, porque, a pesar de tener grados de matemáticas, no saben cómo enseñar las estadísticas. Los padres y los consejeros también se resisten, no quieren cambiar el tiempo de cálculo.

Esto nuevamente confirma que estudiar estadística cambia la percepción de quien ve los datos, además vale la pena.

Ver también: La estadística entre los 10 mejores empleos

La estadística entre los 10 mejores empleos





El año pasado recuerdo que Andrés Gutiérrez nos comentaba que la estadística se encontraba entre los mejores empleos del mundo del 2009, lo que más me llamo la atención es que para el año 2010 seguimos entre los mejores 10 empleos según The Wall Street Journal. Este trabajo fue realizado por la empresa careercast, uno de los portales de trabajo más grande de USA. En promedio un empleado en estadística puede ganar alrededor de 73.000 dólares (146 millones de pesos colombianos) y es uno de los mejores empleos que demandan menos exigencia física y un buen sitio de trabajo. Según la metodología de este estudio los resultados se basaron en cinco criterios: medio ambiente, los ingresos, perspectivas de empleo, las exigencias físicas y el estrés.

El ganador del año pasado fue el matemático aunque su declive se debe a la falta de empleos disponibles durante el 2009 ya que gran parte de su desempeño se realiza con el gobierno y las universidades afectadas por la recesión económica, por ello se bajo las perspectivas de de contratación. El ganador de este año fue el actuario aunque cabe resaltar que para ser actuario hay que saber también de estadística. Los estadísticos por otro lado debemos mejorar las perspectivas de contratación ya que a menudo se cree que el trabajo estadístico es solo "hacer operaciones matemáticas", cosa que no creo ya que la estadística ha venido cogiendo gran auge hasta ser uno de los mejores postgrados .

Espero les haya gustado este resumen. Muchos éxitos.

Ver también: Enseñar Matemáticas o Estadística.

martes, 5 de enero de 2010

Nuevo año 2010 con R y con Bitácoras en Estadística

Comienza un nuevo año y para Bitácoras en Estadística no es la excepción, se han compartido en todo el año 2009 alrededor 50 posts, 100 comentarios, 20 categorías y 213 etiquetas, todo esto ha generado de 11300 visitas, desde su creación en enero del 2009, se han venido incrementando el número de visitas hasta tener un promedio máximo de 80 visitas por día y también se ha contado con un grupo en facebook de 113 personas y se espera seguir creciendo.

Bitácoras en Estadística desea agradecer a todos los diferentes lectores, ustedes son los que hacen este blog recuerden que
Si el mundo no tienen ningún conocimiento de la variación estadística de los datos, no podría interpretar el mundo en que vivimos.
A. J. Zambrano.

En este nuevo año 2010, su servidor comenzara la maestría en estadística y no por ello implica que se deba dejar este blog, se espera seguir compartiendo todas las experiencias no solo con los diferentes lectores, sino también con las personas interesadas en escribir en él, si ese es tu interés hazlo saber y comunícate con este servidor al correo electrónico alexjzc@gmail.com y serás parte de este grupo como autor.

El gráfico que acompaña este post fue creado con el software R. Fue una modificación de un post muy interesante de Yihui Xie, el enseña cómo utilizar la librería animation de R y los utiliza para escribir Happy New Year con R y Merry Christmas usando R. El utiliza un formato de animaciones en flash pero tuve muchos inconvenientes en utilizarlo por lo cual utilice el formato .gif, espero lo disfruten, por cierto el código es el siguiente

library(animation)
saveMovie({
n = length(speed <- runif(angle <- runif(x <- strsplit("FELIZ AÑO 2010",
"")[[1]], 0, 360), 0, 15))
for (j in 1:300) {
angle = angle + speed
plot.new()
plot.window(c(1, n), c(0, 1))
for (i in 1:n) text(i, 0.5, x[i], srt = angle[i], cex = runif(1,
1, 4), col = sample(colors(), 1))
text(n, 0, "Bitácoras en Estadística (http://experienceinstatistics.blogspot.com)",
adj = c(1, 0), col = "white", cex = 0.8)
}
}, interval = 0.04, para = list(mar = rep(0,
4), bg = "black"), width = 640, height = 480)

Éxitos y les deseo un Feliz Nuevo Año 2010.