Podcast de Word Matters

Dentro de nuestros archivos de citas

Episodio 72: Dentro de nuestros archivos de citas

Nuestra oficina de Springfield tiene un archivo de 16 millones de trozos de papel ordenados alfabéticamente, cada uno contiene una cita para una palabra. Algunos de ellos datan del siglo XIX. Muchos están escritos a mano. Entonces... ¿cómocrear esta parte de la historia viva? Es una larga historia.

Descargar el episodioaquí.

Transcripción

Emily Brewster: Próximamente en Word Matters: una visita a los archivos de citas de Meaning88. Soy Emily Brewster y Word Matters es producido por Meaning88 en colaboración con New England Public Media. En cada episodio, los editores de Meaning88, Ammon Shea, Peter Sokolowski, y exploro algún aspecto del idioma inglés desde el punto de vista del diccionario.

La columna vertebral de la lexicografía de mean88 desde sus primeros días es una colección particular y peculiar de datos conocida como archivos de citas. Hoy, Peter y yo vamos a darle un recorrido por esta notable colección. Mientras hablamos, estamos a fines de noviembrede 2021 y en realidad no he trabajado en nuestra oficina de Springfield, Massachusetts desde mediados de marzo de 2020 y lo extraño. Extraño trabajar en nuestra oficina. Una de mis cosas favoritas sobre el significado88 Edificio de oficinas en Springfield,Massachusetts es el olor que tiene. Huele a libros. Huele a biblioteca. También contiene uno de mis recursos favoritos en el mundo, y son nuestros extensos archivos de citas. El departamento editorial está en el segundo piso de este edificio de ladrillos.y hay muchos cubículos, por supuesto, donde los editores se sientan y trabajan en silencio escribiendo en sus teclados, pero la mitad del piso editorial, una gran parte, está ocupada con lo que llamamos los archivos de citas.. Ellos son cajones de archivo.Miden casi metro y medio de altura.

Peter Sokolowski: Gabinetes.

Emily Brewster: Estos archivadores, se parecen a los archivos del catálogo de fichas de las bibliotecas de antaño. Y en esos archivos de citas hay más de 16 millones de hojas de papel. Datan de finales del siglo XIX hasta principios de la década de 2010.Son la columna vertebral de la lexicografía de significado88.

Peter Sokolowski: Absolutamente. Nadie me ha desafiado nunca. Me pregunto si hay otro cuerpo de evidencia recopilada en papel de cualquier idioma en el mundo que sea tan grande. Es solo un recurso masivo, masivo. Muestra el método, en unsentido, solo por estar en ese piso y tener el peso de estos y el espacio que ocupan, especialmente en el medio del piso, ocupan casi todo el espacio y los usamos como una especie de libreros.poner libros encima de ellos.

Emily Brewster: Muchos de ellos ahora también están digitalizados, por lo que no tenemos que hojear estos pequeños pedazos de papel. Como dije, hemos estado recopilando estas citas desde finales del siglo XIX. Y desde la década de 1980, hastalas citas de la década de 2010, podemos ver qué son exactamente, se crearon tanto en formato electrónico como en papel. Puede buscar digitalmente. Y luego, varias de las citas más antiguas de antes de la década de 1980 también se han digitalizado, pero no todas..

Peter Sokolowski: No, no. No. Tienes que levantarte de tu escritorio e ir y abrir un cajón e ir a buscar.

Emily Brewster: Los llamamos los archivos de citas porque la mayor parte de estos cajones de archivos están llenos de lo que llamamos citas. Son extractos de un texto con una palabra o una frase resaltada, generalmente subrayada.ha sido identificado por un editor como de algún interés para un lexicógrafo, como de alguna utilidad para un lexicógrafo. Entonces podría ser que esta sea una palabra nueva que el editor nunca ha visto antes, o es una palabra que han vistoantes, pero este es un ejemplo particularmente bueno de la palabra en uso. Podría ser un nuevo uso de una palabra existente. Podría ser un ejemplo que sería realmente perfecto para incluir en una entrada de definición.

Peter Sokolowski: Un buen ejemplo de una palabra a menudo explica esa palabra.

Emily Brewster: Explica esa palabra. La muestra en su colocación típica. Entonces, estas citas pueden provenir de cualquier cosa. Incluso pueden ser audio, ¿no? Hay citas que se escuchan en la radio, y luego es una transcripción del editor.de lo que habían escuchado en la radio. También son recortes de un menú o de una tira cómica o-

Peter Sokolowski: etiquetas de latas de sopa.

Emily Brewster: ... etiquetas de latas de sopa, sí. Algunas de ellas son de una época en la que literalmente se cortaban y pegaban. Así que alguien las cortó de una revista y luego las pegó en este tres por cinco-

Peter Sokolowski: tamaño estándar.

Emily Brewster: ... papel. Cada hoja de papel en estos archivos de citas es de 3 X 5. Es más liviana que una ficha.

Peter Sokolowski: Y creo que podría haber sido deliberado porque la tarjeta habría ocupado mucho espacio y pensar en el volumen que hay aquí.

Emily Brewster: Así es. Y también sería más caro.

Peter Sokolowski: Por supuesto. Y más difícil de escribir. Muchos de ellos fueron cortados y pegados, a veces subrayados en rojo con marcas en él. Pero algunos de ellos fueron tecleados, fueron escritos en el papel. Algunos de ellos fueronescrito en tinta. Parte de esta tinta ahora está dorada y parte de la escritura es hermosa, parte es más difícil de leer.

Emily Brewster: Los más antiguos están en tinta. Son esos-

Peter Sokolowski: Están en tinta marrón, lo que parece tinta marrón.

Emily Brewster: Puede rastrear la evolución de los bolígrafos.

Peter Sokolowski: Y toda la historia de la duplicación fotográfica. Hay muchos negativos, especialmente en la década de 1950, esa era una forma que vimos mucho. Y luego lo que vimos después, voy a adivinar en elaños 80, era casi como una copia impresa. En otras palabras, se ingresaba claramente en un procesador de textos y luego se imprimía. Así que era una cita de una fuente, como un libro o un periódico, pero se ingresaba con unde nuestros mecanógrafos.

Emily Brewster: A veces, un editor crea una cita que escucha algo en la radio y lo anota y describe la fuente de esta cita.empleados por significado88 y mecanógrafos en la redacción. Y los editores solían tener varias publicaciones a las que la empresa estaba suscrita para ese editor. Usted se registraba para las revistas que deseaba obtener, o para qué diarios. Se entregaban alsignificando 88 oficinas. Y parte de nuestro trabajo todos los días era pasar una hora más o menos leyendo estas diferentes publicaciones. También podías hacer libros, diarios, periódicos, revistas, eso era principalmente lo que estábamos leyendo. Y luego los dejábamos en unarchivador-

Peter Sokolowski: Oh, eso es correcto.

Emily Brewster: ... y los mecanógrafos pasaban, lo recogían y lo llevaban a sus cubículos y lo tipeaban, tipeaban, tipeaban todo. En todo el tiempo que he estado en significado88, desde 2000,, como editor, también he creado citas electrónicas por mi cuenta cuando estoy leyendo en línea. Así que son ambas citas creadas a partir de un texto impreso y luego también citas, estoy en el Poste de Washingtonsitio web y veo un buen ejemplo, y simplemente lo copio y lo pego en un documento especial que tenemos que de alguna manera está vinculado a nuestros archivos de una manera que me desconcierta.

Peter Sokolowski: Es una especie de versión digitalizada de la misma actividad. Es muy familiar, creo que olvidaste mencionarlo, tiene un nombre dedicado, incluso en las hojas de tiempo que solíamos tener. Se llamaba leer y marcarY originalmente, se nos pidió a los editores que tuviéramos alrededor de una hora al día dedicada a leer y corregir. En algunos puntos, incluso había ciertos editores senior que estaban a cargo de leer y corregir y ordenarían qué publicaciones se leían.por qué editores. Tuviste tu propia elección. Creo que tuveTLS, el Suplemento literario del Times, que es un placer leer, buscando el uso británico.

Emily Brewster: lo hiceComida y Vinopor un tiempo-

Peter Sokolowski: Esa es buena.

Emily Brewster: ... y eso se puso un poco difícil al final de la tarde cuando tengo mucha hambre, y estoy leyendo y corrigiendoComida y Vinofue divertido. Yo también lo hice ambiente revista, que fue realmente buena.

Peter Sokolowski: fuente muy rica de lenguaje informal. Esto comienza a mostrar revistas específicas sobre música, sobre comida, también revistas académicas sobre matemáticas, física y biología, y ciertamente revistas legales, revistas de derecho y también periódicos. Incluso en mi tiempo, creo que cada seis meses nos suscribíamos a un periódico geográfico diferente. Uno de Albuquerque y luego otro de Portland, Oregón, solo para lograr este tipo de mayor equilibrio, además de, por supuesto, los grandes como El diario de Wall Street, El New York Times, las grandes revistas, El Atlántico, Harpers, New Yorker. Gran sorpresa, estamos leyendo todo.

Emily Brewster: Correcto. También teníamos muchas novelas y libros de no ficción que estaban llegando y los marcaríamos todos.

Peter Sokolowski: Digamos que tienes un libro sobre la historia de la Segunda Guerra Mundial o algo así, y podrías haber hecho 60 marcas y normalmente pondrías pequeños corchetes angulares a ambos lados del principio y el final de esta oración. Y luegousted subrayaba la palabra o varias palabras en las que quería enfocarse. Y luego, para ayudar a los teclistas, anotamos qué página era.

Emily Brewster: Todas las diferentes páginas del texto que se habían marcado.

Peter Sokolowski: Y para que los mecanógrafos pudieran obtener ese libro y simplemente navegar por el libro e ingresar todas esas citas.

Emily Brewster: Y algunos de esos libros que fueron leídos y marcados irían luego a nuestra biblioteca. Tenemos una biblioteca muy extensa. Eso es lo que más extraño de trabajar en nuestra oficina es no tener acceso a todos los libros.

Peter Sokolowski: Y entonces, a lo que nos referimos es a esta misión básica de describir el lenguaje que requería evidencia y pequeños pedazos de papel han sido parte de la elaboración de diccionarios desde que comenzó la era moderna. Samuel Johnson tenía pequeños pedazos de papel ycasi siempre eran citas literarias, Milton y Spencer y Shakespeare. He visto algunas de estas. Nuestro amigo, John Overholt, que es conservador de colecciones especiales y bibliotecario en Harvard, supervisa una de las colecciones más grandes de material de Samuel Johnson en los Estados Unidos.y me mostró algunos de estos deslices. Lo sorprendente es que tenía amigos o conocidos leyendo libros y luego comentando: "Oh, esta es una palabra interesante y Shakespeare la usa en esta obra en este punto". Y de esa manera,si está en una tarjeta o en una hoja de papel, se puede ordenar alfabéticamente o separar en vocabulario. Y, por supuesto, este también fue el método utilizado por el Oxford English Dictionary, la famosa fotografía de James Murray, el editor delprimera edición del OED, el hombre alto y barbudo con una especie de birrete, de aspecto muy académico. Pero si miras detrás de él en esa fotografía, hay todos estos casilleros donde pondrían las hojas de papel. En significado88, casi se convirtió en una especiedel proceso de la línea de montaje porque todos los editores contribuyeron a esto y luego los mecanógrafos los ingresaban. Y luego había una posición de un empleado que luego los archivaba. Y, de hecho, no se nos permitía archivarlos nosotros mismos..

Emily Brewster: No.

Peter Sokolowski: No sé si recuerdas esto, solo el secretario podía archivarlos. Y esa fue la forma en que aseguramos un gran orden alfabético en el sentido real del orden correcto para todo. Pero tengo que decir, la mayorgrupo de estas palabras, parece que la colección más grande, fue desde finales de la década de 1930 hasta mediados de la década de 1960, esa gran mitad del siglo XX, tiempo durante el cual se realizó la investigación tercera de Webster, cuando Philip Gove, en particular, realmente enfatizó el uso de citas al escribir definiciones.

Emily Brewster: Bueno, y las citas eran todo lo que tenían los editores, lo que tenían los lexicógrafos, para basar sus definiciones, eran solo las citas. Hoy en día tenemos acceso a múltiples corpus y otras bases de datos. Un corpus, pluralcuerpos, es un conjunto cuidadosamente recopilado de fuentes que cumplen diferentes características. Por lo tanto, podría tener un corpus que sea solo de revistas científicas, pero sería equilibrado. Se elegiría muy particularmente qué documentos y fuentes científicas se incluyen en estecorpus. Y entonces alguien sería capaz de filtrarlo en busca de cada instancia de la palabra microbio, por ejemplo, y encontrarlos todos. Y ahora también tenemos acceso a esas cosas. Pero el archivo de citas es algo diferente.no es un corpus, porque no está cuidadosamente equilibrado de esa manera. En cambio, cada cita es un reflejo de la determinación de algún editor de que "Oye, esto es interesante. Esto es útil para escribir un diccionario".

Peter Sokolowski: Sí. Está llegando a algo realmente importante aquí. En primer lugar, ambas son herramientas que se usan al servicio de escribir definiciones, basadas en evidencia, por supuesto. Otra cosa sobre un buen corpus, un corpus equilibrado, como mencionaste, es que no tiene basura. Y lo que quiero decir con eso es que no tiene código ni publicidad y, especialmente, no tiene duplicación. Google, en cierto sentido, es un corpus desordenado.Si busca una palabra dada, puede encontrar que en realidad es el mismo artículo repetido muchas veces, y eso no es útil. A veces queremos hacer una especie de censo y decir: "¿Cuántas veces por millón de palabras se abusa de la palabra micro?"?" Por ejemplo, puedes hacer eso con un corpus bien balanceado, y creo que eso es emocionante. Pero con un sistema de citas, realmente obtienes solo los baches, las cosas que notas, las cosas que generalmente son un poco extraordinarias.o nuevos usos de un término existente. A veces pienso en un corpus bien equilibrado como una especie de horizon.Este es el idioma.Puedes medir las proporciones del lenguaje natural en un corpus, porque es escritura natural.Estos son artículos largos.Pueden ser solo sobre deportes o solo británicos.Pueden estar aislados de ciertas maneras, pero en términos generales, son un uso natural del lenguaje.Un archivo de citas no lo es.Un archivo de citas mide las cosas que observa, que podrían ser pequeños bultos en el horizonte, los pequeños bultos que no tienen el lenguaje de conexión entre ellos.Y eso fue notado, de hecho, por Philip Gove, el editor de tercera de Webster, quien reconoció que teníamos una gran cantidad de evidencia para la terminología más oscura, porque esas son las cosas que nos inclinaríamos a notar y citar. Y así hubo un punto durante la producción de tercera de Websteren el que ordenó que, fuera lo que fuera, la cuarta palabra de la página 35 de cada libro que se leyera, tenía que convertirse en una cita-

Emily Brewster: ¿Qué?

Peter Sokolowski: ... sí, solo para hacer una serie de citas y citas básicas en lenguaje normal.

Emily Brewster: Nunca había escuchado eso antes. Eso es absolutamente fascinante.

Peter Sokolowski: E hizo que los mecanógrafos hicieran eso. Y parte de eso era que, a veces, había un retraso. Durante la producción de un diccionario, los mecanógrafos hicieron dos cosas. Teclearon el manuscrito y luego teclearon elcitas. Entonces, lo que sucedería es que el manuscrito vendría y se iría en diferentes oleadas. Irían a la composición tipográfica y luego irían a la impresión y habría corrección de pruebas. Habría todas estas etapas durante las cuales el tiempolos mecanógrafos eran libres de escribir muchas más citas. A veces, en esos espacios, ellos mismos también hacían citas, no de la lectura del editor, sino de una especie de tercera palabra mecánica en la tercera página, ya sabes, ese tipo de cosas.eso es interesante. Gove quería un corpus y no tenía uno. Así que tuvo ese instinto de buscar uno.

Emily Brewster: Bueno, la tecnología estaba en el horizonte, pero aún no había llegado. Y ahora, en esta era moderna, desde finales del siglo XX, la lexicografía de corpus ha sido la forma principal, la forma más común, en que los diccionarios sonhecho. Y significado88 también hace lexicografía de corpus. Pero realmente no puedo imaginarme haciendo lexicografía que se basara únicamente en corpus. Las citas son muy valiosas, especialmente para palabras comunes, porque si se sienta a revisar la entrada para nosotros, como lo hice parala Diccionario colegiado 11, y esto habría sido alrededor de 2002 más o menos, para buscar en un corpus todos los ejemplos del artículoa. Buscaría diferentes colocaciones, buscaría diferentes posiciones en una oración que a se usa, qué tipo de palabras viene antes o después. Pero usando las citas, terminas con una colección de ejemplos de la palabra, a, que son notables de alguna manera.

Peter Sokolowski: Por supuesto, son diferentes.

Emily Brewster: Y eso le dice al lexicógrafo, realmente hace ese trabajo de reducir para que el lexicógrafo pueda mirar a través y sigue siendo una pila enorme como lo es para cualquier palabra común.

Estás escuchando Word Matters. Soy Emily Brewster. Volveremos en un minuto con más historias de los archivos de citas. Word Matters es una producción de significado88 en colaboración con New England Public Media.

Ammon Shea: Soy Ammon Shea. ¿Tiene alguna pregunta sobre el origen, la historia o el significado de una palabra? Envíenos un correo electrónico a [email protected].

Peter Sokolowski: Soy Peter Sokolowski. Únase a mí todos los días para la Palabra del día, una breve mirada a la historia y la definición de una palabra disponible en merriam-webster.com o donde sea que obtenga sus podcasts. Y para máspodcasts de New England Public Media, visite el centro de podcasts de NEPM, en nepm.org.

Emily Brewster: El contenido de los archivos de citas no son solo sus citas. También hay conversaciones que tienen lugar durante un período de años. Te leeré una. Los archivos de citas no son un corpus, son una colección curada.-

Peter Sokolowski: Esa es una buena manera de decirlo.

Emily Brewster: ... de información relevante.

Peter Sokolowski: También hay comentarios e incluso argumentos en algunos de estos que verías pequeñas cosas yendo y viniendo. Desearía poder recordar un argumento. Recuerdo que ha habido un par de memorables.

Emily Brewster: Tengo uno. Las citas de las que hemos estado hablando, estos extractos de texto, siempre están en hojas de papel blancas. Las definiciones que se redactan están en lo que llamamos hojas de papel, pero son amables.de una vainilla, amarillento-

Peter Sokolowski: Beige.

Emily Brewster: ... color beige. Y luego se usaron tiras de papel azules para las citas de los autores y luego pedazos de papel rosas, simplemente los llamamos rosas, y se usan para comenzar una pelea.

Peter Sokolowski: Sí. Preguntas, comentarios, correcciones.

Emily Brewster: Sí. Preguntas, comentarios y correcciones.

Peter Sokolowski: Si ve un error, por ejemplo, si está en casa y encuentra un error tipográfico en uno de nuestros diccionarios, en los viejos tiempos, había 40, 50 editores en el piso. Usted nosaltar y decir: "Oye, encontré un error". Lo anotaste en el recibo y el número de página iría en una esquina. Y la suma iría en la otra esquina y la palabra principal iría en el medio yentonces simplemente haría su comentario.

Emily Brewster: Así es. Y luego estaba en trámite y se actuaría según lo permitieran los cronogramas de publicación.

Peter Sokolowski: La próxima vez que se abra esa página, por ejemplo, podría haber un caso en el que se podría agregar una nueva definición a una palabra que cayó en esa página. Y eso significa que si abren esa página, en el sentido de composición tipográfica, podrían hacer una corrección fácil por muy poco dinero.

Emily Brewster: Así es. Ahora solo lo ponemos en una hoja de cálculo compartida. Sí, es muy aburrido.

Peter Sokolowski: Es menos emocionante. ¿Pero de qué estás hablando?

Emily Brewster: Tengo un rosa de W2, 2º de Webster estaba siendo revisado. Esto se refiere a una definición en Segundo diccionario internacional de Webster, se publicó en 1934. Y Oaks ha escrito una pregunta, o tal vez Sheffield, no está claro. Hay un montón de nombres y sellos de fecha aquí.

Peter Sokolowski: Cada editor tenía un sello que también daba la fecha, con su nombre y fecha. Sí.

Emily Brewster: Entonces esta pregunta dice: "La palabra principal es preposición. ¿El hecho de que una preposición pueda seguir en la posición de su objeto parece lo suficientemente importante como para decir qué es una preposición para tomar cuatro líneas, es mejor omitirlo". "Tenemosya dicho anteriormente, generalmente se coloca antes de la palabra", etcétera, pero luego hay una respuesta de alguien con el apellido Thomas: "Todavía hay en el extranjero en la tierra, una gran cantidad de magistrales escolares que sienten que tales locuciones son un pocofuera de color por violar la etimología de la posición anterior. Debo conservar la declaración."

Peter Sokolowski: Guau. Así que tienes estos debates que tienen lugar. También tengo uno frente a mí de los años 50, supongo que fue del tiempo de producción de-

Emily Brewster: '59.

Peter Sokolowski: Muchos de ellos de los años 50 durante la gran producción de tercera Webster. Este está escrito a mano, fuddy-duddy. Y por cierto, si escribes esto a mano, tiene una línea ondulada debajofuddy-duddy, porque eso indica negrita. En este caso, se refiere a una palabra principal, fuddy-duddy, sustantivo con una sola línea debajo, lo que significa que está en cursiva y luego el comentario. "Con el mundo tan lleno de ellos, no podemos dejar que esto se quede fuera durante otra edición". En otras palabras, fue unrecomendación en este caso que agreguemos una nueva entrada para el término fuddy-duddy.

Emily Brewster: Pero el término no está definido.

Peter Sokolowski: Es divertido, es una sugerencia sin un borrador de definición.

Emily Brewster: Debo decir que no es mi tipo de nota favorita para recibir, alguien que dice: "Realmente necesitamos definir esta palabra", pero no ha hecho nada.

Peter Sokolowski: Correcto. Recientemente ingresamos al términomuerte de pelusa en el diccionario, y llamó mucho la atención.

Emily Brewster: Está en pan blanco, es mantequilla de maní y crema de malvavisco.

Peter Sokolowski: Marsh cream, correcto. Aparentemente es regional del noreste. Es un término que nunca no supe, así que no sabía que era regional. Pero lo busqué en nuestros archivos de citas yEncontré uno de 1980, El New York Times. Es un periódico pegado a la tarjeta con muerte de pelusa tecleado en la parte superior para que se pueda ordenar alfabéticamente. Pero luego, en la tinta morada fuertemente estampada, dice rechazado por 9 coll, COLL, rechazado por el Diccionario Colegiado 9, 1983. Y justo encima, dice rechazado por C-10, el 10º Colegiado en 1993. Y luego en el siguiente recibo, dice rechazado por C-11, por el 11 ° Colegiado. Y esto es realmente lo que sucede. Es como una cinta transportadora. Las palabras van y vienen. Pero algunas palabras crecen en frecuencia, y crecen en moneda, crecen en popularidad. Y esta es una que habíamos estado observando literalmentedécadas Y finalmente entró, en 2021.

Emily Brewster: Así es. Pero para cada uno de esos libros que conducen a muy recientemente-

Peter Sokolowski: Fue evaluado.

Emily Brewster: se evaluó y se consideró que aún no cumplía con nuestros criterios, no tenía un uso suficientemente generalizado.

Peter Sokolowski: Y realmente dependimos de esta evidencia. La evidencia fueron las citas. Hay algo que solía decir Fred Mish, y Fred Mish era el editor en jefe de tres ediciones del Colegiado, el 9, el 10 y el 11. Y es alguien a quien ambos conocíamos y con quien trabajábamos. Pero solía decir: "Nada es tan humillante como un viaje a los archivos de citas". Y eso es algo interesante. Éltambién diría que el requisito previo para conseguir un trabajo en significado88 es que tienes que someter tu prejuicio lingüístico a la evidencia que tienes ante ti, y realmente de lo que está hablando es de las citas.

Emily Brewster: Háganos saber lo que piensa sobre Word Matters. Revísenos, dondequiera que obtenga sus podcasts, o envíenos un correo electrónico a [email protected]. También puede visitarnos en nepm.org. Y para la Palabra delDay y todas sus necesidades generales de diccionario, visite merriam-webster.com. Nuestro tema musical es de Tobias Voigt, arte de Annie Jacobson. Word Matters es producido por John Voci y Adam Maid. Para Peter Sokolowski y Ammon Shea, soy EmilyBrewster. Word Matters es producido por Meaning88 en colaboración con New England Public Media.

¿Palabras de amor? ¿Necesita aún más definiciones?

Suscríbase al diccionario más grande de Estados Unidos y obtenga miles de definiciones más y búsqueda avanzada, ¡sin publicidad!