Las grabaciones de la producción lingüística de Simon y Leo del corpus FerFuLice comenzaron en febrero de 2000, cuando los gemelos tenían 13 meses, y continuaron hasta la edad de 6;11.
Las grabaciones se efectuaron siguiendo el procedimiento especificado en la bibliografía sobre adquisición del lenguaje, tanto monolingüe como bilingüe (Slobin 1985, De Houwer 1990, López Ornat 1994, McDaniel et al. 1995, Thornton 1996, Rice et al. 1999, Bel 2001, por citar alguna).
En total se han grabado 178 sesiones en formato audio-video digital, de las cuales 117 están en un contexto inglés (donde los niños interactúan con un interlocutor nativo inglés, que es uno de los investigadores o la madre) y 61 en un contexto español (con un interlocutor nativo español, que es una de las investigadoras o el padre). Las sesiones en español se realizaron cada 15 días hasta la edad de 3;00 y después una vez al mes. Las sesiones en inglés se realizaron con más frecuencia, pero eran de duración más corta y grabadas en días consecutivos. Los investigadores interrumpían las grabaciones periódicas en el verano y durante aproximadamente los dos meses en los que la familia viajaba a Estados Unidos.
En ese periodo, los padres las retomaban para asegurar así una continuidad en la recogida de datos. Las grabaciones recogen situaciones de la vida diaria en las que Simon y Leo juegan con los padres e investigadores en casa y en las que suelen aparecer juntos.
Las transcripciones de las 178 sesiones que componen el corpus FerFuLice han sido realizadas en su totalidad en formato CHAT para la base de datos CHILDES (MacWhinney 2000).
Las sesiones en español han sido transcritas por nativos de español del equipo de investigación de la Universidad de Valladolid dirigido por Raquel Fernández Fuertes. Las sesiones en inglés han sido transcritas por nativos de inglés del equipo de investigación de la Universidad de Ottawa (Canadá) dirigido por Juana M. Liceras. Asimismo, aparecen algunas sesiones bilingües en las que los dos equipos de transcripción han colaborado. En estas sesiones bilingües se incluyen tres pruebas de traducción.
Las sesiones están denominadas correlativamente (01, 02, 03, etc.) excepto en algunos casos en los que se utilizan letras para las distintas sesiones (31a, 31b, 31c). Dentro de cada sesión, los distintos archivos marcan el límite aproximado de 1.000 enunciados por archivo (01_1, 01_2).
Inventario: información detallada de cada sesión (LMEp, número de enunciados, etc.).
Formato CHAT: información detallada de las pautas seguidas en la transcripción.