Posts tagged ‘littera’

Machine Translator

FIRST TEXT

Original version in English

Atlanta Beginnings

Like many people who change history, John Pemberton, an Atlanta pharmacist, was inspired by simple curiosity. One afternoon, he stirred up a fragrant, caramel-colored liquid and, when it was done, he carried it a few doors down to Jacobs’ Pharmacy. Here, the mixture was combined with carbonated water and sampled by customers who all agreed — this new drink was something special. So Jacobs’ Pharmacy put it on sale for five cents a glass.

Pemberton’s bookkeeper, Frank Robinson, named the mixture Coca-Cola®, and wrote it out in his distinct script. To this day, Coca-Cola is written the same way. In the first year, Pemberton sold just 9 glasses of  Coca-Cola a day.

Spanish version translated by Lucy Translator

Principios de Atlanta

Como mucha gente que cambia historia, John Pemberton, un farmacéutico de Atlanta, era inspirado por la curiosidad sencilla. Una tarde, removía un líquido fragante, de color de caramelo y, cuándo se hacía, era|tenía portador de ello unas cuantas puertas hacia abajo a la Farmacia de Jacobs. Aquí, la mezcla se combinaba con gaseosa y era probado por clientes|clientela que todo aceptaba — esta bebida nueva era algo especial. Así la Farmacia de Jacobs lo ponía en venta cinco centavos|céntimos un cristal|vaso.

El contable de Pemberton, Frank Robinson, nombraba el Cola® de Coca de mezcla, y lo escribía en su guión claro. A este día, Coca-Cola es escrita la misma forma|camino. En el primer año, Pemberton vendía sólo|justo un día a 9 gafas|vasos de Coca-Cola.

Spanish version translated by Google Translator

Comienzos Atlanta

Como muchas personas que cambiar la historia, John Pemberton, un farmacéutico de Atlanta, fue inspirado por la simple curiosidad. Una tarde, se suscitó un líquido fragante, de color caramelo y, cuando estuvo listo, se lo llevó, a pocos a la farmacia Jacobs. En este caso, la mezcla se combina con el agua carbonatada y se tomaron muestras a los clientes que todos estaban de acuerdo – esta nueva bebida era algo especial. Así farmacia Jacobs la puso a la venta por cinco centavos el vaso.

contador de Pemberton, Frank Robinson, nombrada la mezcla de Coca-Cola ®, y lo escribió en su guión distinto. A día de hoy, Coca-Cola se escribe del mismo modo. En el primer año, Pemberton vendió a 9 vasos de Coca-Cola al día.

Machine Translators’s main problems

Vocabulary mistakes:

Ing: stirred up -> MT: suscitó -> Sp: removió

Ing: A few doors down -> MT: a pocos -> Sp: unas pocas puertas mas abajo:

The translator is unable to translate that sentence.

Ing: Cents -> MT: centavos -> Sp: céntimos:

«centavos» could be also right but «céntimos» is better.

Ing: Bookkeeper -> MT: contador -> Sp: contable

Semantic problems:

Ing: custumores who all agreed -> MT: los clientes que todos estaban de acuerdo – > Sp: a los clientes quienes todos estuvieron de acuerdo:

It is not a relative clause so the use of «que» is wrong. Moreover there is a verbal mistake in the tense «estaban» as it is not referring to a recent past but to a distant one so the correct form would be «estuvieron».

Order problems:

Ing: sold just 9 glasses of Coca Cola a day -> MT: vendío a 9 vasos de Coca Cola al día -> Sp: vendío solo 9 vasos de Coca-Cola al día:

«9 vasos»  is not the price of Coca Cola so its use is not right here. In addition the translator has not added the translation of the word «just» that means solo in Spanish, so I have replaced the word «a» by «solo»

Syntactic mistakes:

Ing: Atlanta beginnings -> MT: Comienzos Atlanta -> Sp: Comienzos en Atlanta

The translator has not included the preposition «en» in its translation.

Ing: Jacob’s farmacy -> MT: la farmacia Jacobs -> Sp: la farmacia de Jacob: The translator is unable to distinguise the posession is this sentence, that is, it does not translate the apostrophe in «Jacob’s» that its meaning woulde be «de» in Spanish.

Ing: Named -> MT: nombrada -> Sp: nombró: The translator has translated «named» as the participle «nombrada» and in this case it is an action carried out by someone so the correct form would be «nombró»

Human Translation version

Comienzos en Atlanta

Como muchas personas que cambian la historia, John Pemberton, un farmacéutico de Atlanta, fue inspirado por la simple curiosidad. Una tarde, removió un líquido fragante, de color caramelo y, cuando estuvo listo, se lo llevó, unas pocas puertas mas abajo a la farmacia de Jacob. Aquí, la mezcla se combinó con agua carbonatada y se tomaron muestras a los clientes quienes estuvieron todos de acuerdo – esta nueva bebida fue algo especial. Entonces la farmacia de Jacob la puso a la venta por cinco céntimos el vaso.

El contable de Pemberton, Frank Robinson, nombró a la mezcla Coca-Cola ®, y lo escribió en su guión definido. A día de hoy, Coca-Cola se escribe de la misma manera. En el primer año, Pemberton vendió solo 9 vasos de Coca-Cola al día.

SECOND TEXT

Original version in English

Facebook

Facebook is a social networking website that is operated and privately owned by Facebook, Inc. Since September 2006, anyone over the age of 13 with a valid e-mail address can become a Facebook user. Facebook’s target audience is more for adults than youths. Users can add friends and send them messages, and update their personal profiles to notify frie nds about themselves. Additionally, users can join networks organized by workplace, school, or college. The website’s name stems from the colloquial name of books given to students at the start of the academic year by university administrations in the US with the intention of helping students to get to know each other better.

Spanish version translated by Lucy Translator

Facebook

Facebook es un sitio web de conexión en red social que se lleva|realiza a cabo y de forma particular|privada es poseído por Facebook, Inc. Desde septiembre de 2006, cualquiera sobre la edad de 13 con una dirección de correo electrónico válida se puede convertir en un usuario de Facebook. La audiencia de meta de Facebook es más para adultos que las juventudes. Los usuarios pueden añadir amigos y enviarles mensajes, y actualizar sus perfiles individuales para informar amigos sobre ellos mismos. Adicionalmente, los usuarios se pueden unir a redes organizadas por lugar de trabajo, escuela, o colegio|universidad. El nombre del sitio web se deriva del nombre coloquial de lib ros dados a estudiantes en el principio del año académico por administraciones de universidad en los EE.UU. con la intención de estudiantes de porción de ponerse a saber mejor.

Spanish version translated by Google Translator

Facebook

Facebook es un sitio web de redes sociales que es operado y propiedad privada de Facebook, Inc. Desde septiembre de 2006, cualquier persona mayor de 13 años con una dirección válida de correo electrónico puede convertirse en un usuario de Facebook. audiencia de Facebook objetivo es más para los adultos que jóvenes. Los usuarios pueden añadir amigos y enviarles mensajes, y actualizar sus perfiles personales para notificar a los amigos acerca de sí mismos. Además, lo s usuarios pueden unirse a las redes organizadas por el lugar de trabajo, la escuela o la universidad. El nombre del sitio proviene el nombre coloquial de los libros dados a los estudiantes al inicio del año académico por las administraciones universitarias en los EE.UU. con la intención de ayudar a los estudiantes para llegar a conocerse mejor.

Machine Translators’s main problems

Syntactic mistakes:

Ing: Facebook’s target audience -> MT: Audencia facebook objetivo -> Sp: la audiencia que tiene facebook como objetivo:

In this case, the translator is unable to do a relative sentence with these three words.

Ing: to get to know each other better-> MT: para llegar a conocerse mejor -> Sp: para llegar a conocerse mejor entre ellos

The translator  has not translated the words «each other».

Vocabulary mistakes:

Ing: operated -> MT: operado-> Sp: dirigido :

There is a literal translation from English to Spanish that in this case is not valid.

Human Translation

Facebook

Facebook es un sitio web de redes sociales que es propiedad privada y dirigida por Facebook, Inc. Desde septiembre de 2006, cual quier persona mayor de 13 años con una dirección válida de correo electrónico puede convertirse en un usuario de Facebook. La audiencia que tiene Facebook como objetivo son adultos más que jóvenes. Los usuarios pueden añadi r amigos y enviarles mensajes, y actualizar sus perfiles personales para notificar a los amigos acerca de sí mismos. Además, los usuarios pueden unirse a las redes organizadas por el lugar de trabajo, la escuela o la universidad. El nombre del sitio proviene del nombre coloquial de los libros que se dan a los estudiantes al inicio del año académico por las administraciones universitarias en los EE.UU. con la intención de ayudar a los estudiantes para llegar a conocerse mejor entre ellos.

THIRD TEXT

Original version in English

A synopsis of the story (Mean Girls)

Cady Heron has led an exciting but sheltered life, being brought up and home schooled by her research scientist parents in Africa. That all changes however when at the age of 16, the family move back to America and Cady goes to a public high school. She gets a major culture shock when she finds the school segregated into various groups such as the Asian Nerds, the Cool Asians, the Sexually Active Bambies and, high in the pecking order, the Plastics. This is a group of three girls, Regina, the queen bee and her workers Gretchen and Karen who are all in love with themselves.

The first person to befriend Cady is gothic Janis, reputed to be a lesbian, who lets Cady in on the social hierarchy at the school. Janis used to be best friends with Regina in Middle School but they fell out and are now enemies. When Regina decides to invite Cady into the Plastics which is such an honour, Janis sees this as a way to sabotage the group. Together with friend Damien, who’s gay, Janis and Cady devise ways to bring down the Plastics.

Spanish version translated by Lucy Translator

Una sinopsis de la historia (Chicas Malas|Medias)

Cady Heron ha conducido una vida emocionante pero protegida, siendo educado y a casa escolarizada por sus padres de científico de investigación en África. Eso todos los cambios sin embargo cuando a la edad de 16, la familia retirarse a América y Cady va a un instituto de bachillerato público. Lleva una sorpresa de cultura esencial cuando encuentra que la escuela separaba en diversos grupos como el asiático Nerds, los Asiáticos Frescos|Fríos, el Sexually Active Bambies y, a gran altura en el orden que picotea, la Plástica. Esto es un grupo de tres chicas, Regina, la abeja reina y sus trabajadores Gretchen y Karen que están completamente enamorados con ellos mismos.

La primera persona para ofrecer amistad a Cady es Janis gótica, supuesta de ser una lesbiana, que informa a Cady de la jerarquía social en la escuela. Los Janis solían ser mejores amigos con Regina en la Escuela del Medio pero se peleaban y son ahora enemigos. Cuando Regina decide invitar a Cady en la Plástica que es un tal honor, Janis ve esto como una forma de sabotear el grupo. Juntamente con el amigo Damien, quien es gay, Janis y Cady idean formas|caminos hacer derribar la Plástica.

Spanish version translated by Google Translator

Una sinopsis de la historia (Chicas malas)

Cady Heron ha llevado una vida emocionante, pero protegido, siendo criado y educado en casa por sus padres el científico de investigación en África. Todo eso cambia sin embargo, cuando a la edad de 16 años, la familia se mudara de nuevo a América y Cady va a una escuela secundaria pública. Acaba con el choque cultural importante cuando se encuentra la escuela segregada en varios grupos, como los novatos de Asia, los asiáticos Frío, la Bambies sexualmente activos y, en lo alto de la jerarquía, los plásticos. Este es un grupo de tres niñas, Regina, la abeja reina y sus trabajadores Gretchen y Karen, que son todos los enamorados de sí mismos.

La primera persona en hacer amistad con Cady es Janis gótico, tiene fama de ser una lesbiana, que permite Cady en la jerarquía social en la escuela. Janis solía ser el mejor amigo de Regina en la escuela media, pero se cayó y ahora son enemigos. Cuando Regina decide invitar a Cady en el plástico que es un gran honor, Janis ve esto como una manera de sabotear el grupo. Junto con su amigo Damián, que es gay, Janis y Cady idear maneras de reducir el plástico.

Machine Translators’s main problems

Gender mistakes:

Ing: sheltered -> MT: protegido -> Sp: protegida

Ing: being brought up -> MT: siendo criado-> Sp: siendo criada

Ing:Home schooled-> MT: educado en casa-> Sp: educada en casa

Agreement mistakes:

Ing: scientists parents -> MT: sus padres el cientifico-> Sp: sus padres cientificos

Problems with verbal tenses:

Ing: move back-> MT: se mudara-> Sp: se muda

Ing: Janis used to be best friend with Regina -> MT: Janis solía ser el mejor amigo de Regina -> Sp: Janis era la mejor amiga de Regina

Vocabulary mistakes:

Ing: she gets a major culture shock -> MT: acaba con el choque cultural-> Sp: ella se encuentra con un choque cultural

Ing: Nerds -> MT: Novatos -> Sp: Empollones

Ing: Cool -> MT: Frío -> Sp: Guays

Ing: Sexually Active Bambies-> MT: Bambies sexualmente activos -> Sp: salidos sexuales

Ing: The Plastics-> MT: los plásticos -> Sp: las Divinas

Ing: girls -> MT: niñas -> Sp: chicas

Ing: reputed to be a lesbian -> MT: tiene fama de ser una lesbiana -> Sp: considerada una lesbiana.

Ing: who lets Cady in -> MT: Que permite Cady -> Sp: la cual acepta a Cady

Ing: in Middle School -> MT: en la escuela media -> Sp: en la escuela primaria

Ing: but they fell out -> MT: Pero se cayó -> Sp: pero se enfadaron

Ing: sabotage -> MT: sabotear-> Sp: boicotear

Syntactic problems

Ing: Who are in love with themselves -> MT: que son todos enamorados demismos -> Sp: que están todas enamoradas de ellas mismas

Order problems

Ing: Gothic Janis-> MT: Janis gótico -> Sp: la gótica Janis

Human Translation

Una sinopsis de la historia (Chicas Malas)

Cady Heron ha llevado una vida emocionante pero protegida, siendo criada y educada en casa por sus padres científicos de investigación en África. Todo eso cambia sin embargo, cuando a la edad de 16, la familia se muda de nuevo a América y Cady va a una escuela secundaria pública. Ella se encuentra con un choque cultural importante cuando se encuentra la escuela segregada en varios grupos, como los Asiáticos Empollones, los Asiáticos Guays, Salidos Sexuales y, en lo alto de la jerarquía, las Divinas. Este es un grupo de tres chicas, Regina, la abeja reina y sus obreras Gretchen y Karen, que están enamoradas de ellas mismas.

La primera persona en hacer amistad con Cady es la gótica Janis, considerada una lesbiana, la cual acepta a Cady en la jerarquía social en la escuela. Janis era la mejor amiga de Regina en la escuela primaria, pero se enfadaron y ahora son enemigas. Cuando Regina decide invitar a Cady en las Divinas que es un gran honor, Janis ve esto como una manera de boicotear el grupo. Junto con su amigo Damián, que es gay, Janis y Cady idean maneras de acabar con las Divinas.


SOURCES

Coca-Cola History: Coca-Cola Heritage Timeline. Retrieved 12:53, julio 21, 2010 from http://heritage.coca-cola.com/

Facebook. (2010, July 21). In Wikipedia, The Free Encyclopedia. Retrieved 10:56, July 21, 2010, from http://en.wikipedia.org/w/index.php?title=Facebook&oldid=374615838

YMA Movie Review – Mean Girls. Retrieved 12,56, July 21, 2010, from http://www.youngmedia.org.au/mediachildren/07_04/07_04_104_mean_girls.htm

Traductor de Google. Retrieved 12:57, July 21, from http://translate.google.com

Lucy Software and Services GmbH. Retrieved 12:58, July 21, from http://www.lucysoftware.com

May 9, 2010 at 10:35 pm 1 comentario

Synonym Dictionary

When I need to look for a meaning of any word I usually use Wordreference as it offers many meanings depending or the context this word is used. Moreover, there are several sentences and expressions taken as an example in which this word is used, that is the reason that made me choose this web page as my main dictionary when I am working on computer. Nevertheless, I do not use to find synonyms on Wordreference, but only the definition of the word so I had to look for other web pages on the Internet.

After having taken a look on some web pages, I have selected Yourdictionary in order to know which dictionary I can choose as a synonym dictionary. Luckily,  by clicking on one of the top page’s buttons called Other Dictionaries, I have found a page which offers many links of online dictionaries and I have selected that one : Synonym Dictionary

That online free dictionary is a great resource for English synonyms, antonyms and definitions.  To begin with, type in a word and the synonym finder will come up with a list of synonyms. Then, the antonym tool can be used to find antonyms and check out the definitions feature to read the definition. I will start with the word «pretty» taken as an example in order to take a look at the synonyms:

As we can see, the finder give us some alternatives we can use instead of «pretty» depending on the sense of the word. Moreover, there is the choice of browsing the antonym and the definition of the same word:

Finally, I will show the option of browsing the definition of the word searched:

Finally, I would like to point out that this web page also contains some sponsored links that can be useful.

SOURCES

Dictionary and Thesaurus Yourdictionary. Retrieved: 13:00, July 21, 2010 from www.yourdictionary.com

Synonyms Thesaurus with Antonyms and Definitions. Retrieved: 13:00, July 21, 2010 from www.synonyms.com

abril 18, 2010 at 10:38 pm 11 comentarios

Terminología

Amanuense:

(Del lat. amanuensis).

1. com. Persona que tiene por oficio escribir a mano, copiando o poniendo en limpio escritos ajenos, o escribiendo lo que se le dicta.

2. m. Escribiente de un despacho, oficina o tribunal.

Códice:

Del lat. codex, -ĭcis).

1. m. Libro anterior a la invención de la imprenta.

2. m. Libro manuscrito de cierta antigüedad.

3. m. Rel. Parte del misal y del breviario que contiene los oficios concedidos a una diócesis o corporación particularmente.

Miniado:

1. adj. Pintado, ilustrado de miniatura.

Colofón:

(Del lat. colŏphon, -ōnis, y este del gr. κολοφών, término, fin).

1. m. Impr. Anotación al final de los libros, que indica el nombre del impresor y el lugar y fecha de la impresión, o alguna de estas circunstancias.

2. m. Remate, final de un proceso. La velada tuvo un brillante colofón con las palabras del presidente.

Copyleft:

s una forma de licencia y puede ser usado para modificar el derecho de autor de obras o trabajos, tales como software de computadoras, documentos, música, y obras de arte.

Copyright:

derecho de autor.

1. m. El que la ley reconoce al autor de una obra intelectual o artística para autorizar su reproducción y participar en los beneficios que esta genere.

Filigrana:

(Del it. filigrana).

1. f. Obra formada de hilos de oro y plata, unidos y soldados con mucha perfección y delicadeza.

2. f. Señal o marca transparente hecha en el papel al tiempo de fabricarlo.

3. f. Cosa delicada y pulida.

4. f. Cuba. Arbusto silvestre, de la familia de las Verbenáceas, con hojas ásperas, aromáticas, aovadas, de bordes ondulados, flor menuda y fruto apiñado.

Glosa:

(Del lat. glossa, palabra oscura, que necesita explicación, y este del gr. γλῶσσα, lengua).

1. f. Explicación o comentario de un texto oscuro o difícil de entender.

2. f. Nota que se pone en un instrumento o libro de cuenta y razón para advertir la obligación a que está afecto o sujeto algo, como una casa, un juro, etc.

3. f. Nota o reparo que se pone en las cuentas a una o varias partidas de ellas.

4. f. Composición poética a cuyo final, o al de cada una de sus estrofas, se hacen entrar rimando y formando sentido uno o más versos anticipadamente propuestos.

5. f. Mús. Variación que diestramente ejecuta el músico sobre unas mismas notas, pero sin sujetarse rigurosamente a ellas.

Papel vitela:

m. El liso y sin grano, de gran calidad, cuya superficie permite la reproducción detallada de los dibujos más finos.

Piedra de Rosetta:

Es una estela de granito negro, con una inscripción bilingüe (griego y egipcio) de un d del faraón Ptolomeo V, en tres formas de escritura: jeroglífica, demótica y griego uncial (con letras mayúsculas); contiene noventa y dos renglones, los catorce primeros escritos con signos jeroglíficos, los siguientes 32 en caracteres demóticos, y los últimos 54 en griego; tiene algo más de un metro de alto, 72 cm de ancho y 27 cm de grosor; pesa 756 kg.

FUENTES:

Real Academia Española. Retrieved 13:02, July 21, 2010 from http://www.rae.es/rae.html

Piedra de Rosetta. (2010, 8) de julio. Wikipedia, La enciclopedia libre. Fecha de consulta: 11:03, julio 21, 2010 from http://es.wikipedia.org/w/index.php?title=Piedra_de_Rosetta&oldid=38660398.

Copyleft. (2010, 24) de junio. Wikipedia, La enciclopedia libre. Fecha de consulta: 11:04, julio 21, 2010 from http://es.wikipedia.org/w/index.php?title=Copyleft&oldid=38303500.


diciembre 20, 2009 at 5:36 pm 1 comentario

La Documentación digital

Una publicación  electrónica es aquella que ha sido producida y distribuída por medio de sistemas electrónicos y que tiene que ser leída en un dispositivo informático. Puede ser distribuída en vías diferentes:

  • Soporte documental: óptico o magnético
  • En línea (a través de las redes de telecomunicaciones): formato web (html) o formato ascii

De todas estas formas las que se utilizan actualmente son la distribución en soporte óptico y por web.

Las publicaciones electrónicas tienen sus desventajas:

  • Poca presencia de productos editoriales: según algunos editores profesionales no hay un beneficio tangible inmediato a obtener.
  • Los recursos utilizados son bastante limitados: la red no permite trabajar con recursos muy avanzados

A continuación daré la definición de un documento (en el ámbito de la Bibliotecología tradicional) y sus características:

Se habla de documento para referirse a cualquier unidad significativa de información que haya sido registrada en un soporte que permita su almacenamiento y su posterior recuperación. Cualquier soporte que permita, simultáneamente, multiplicar ilimitadamente la consulta de la información en él registrada y postergarla indefinidamente en el tiempo.

De acuerdo a lo anterior, cualquier conjunto de información que conforme una unidad significativa independiente, registrada en un soporte electrónico, constituye también un documento. Cualquier unidad significativa independiente de información registrada en un diskette, en un CD Rom o en un disco duro, es un documento digital.

El documento hipertextual está formado por partes interrelacionadas entre sí que se pueden recorrer en muchas direcciones y siguiendo órdenes diversos.

Los principales recursos de información que podemos encontrar por tipologías de documento son:

  • Documentos secundarios:  bibliotecas que tienen sus catálogos accesibles en la web y bases de datos.
  • Documentos primarios: monografías, prensa diaria, revistas especializadas, publicaciones especiales.
  • Información sobre todo tipo de organizaciones: administraciones públicas, organismos sin ánimo de lucro y también el sector privado.

Todos estos recursos  permiten ofrecer a los ciudadanos todo tipo de información.

Ventajas del documento digital en relación al documento escrito:

  • Información multimedia: posibilidad de integrar texto, sonido e imagen en un mismo documento.
  • Interactividad: posibilidad de establecer una comunicación entre el escritor y el lector.
  • Recuperación de la información: cualquier parte de la publicación electrónica puede ser recuperable.
  • Actualización: Los contenidos pueden renovarse y ponerse al día constantemente.
  • Densidad: la cantidad de información por unidad de volumen es infinitamente superior utilizando un soporte digital que sobre papel.
  • Acceso a los títulos: se puede acceder de forma inmediata.
  • Virtualidad: Facilidad del libro digital para ser reproducido, transmitido y almacenado.

Las desventajas más importantes que podemos encontrar son las siguientes:

  • Mediatización: La consulta de una publicación electrónica necesita de un ordenador, sin el es imposbile acceder al contenido de la publicación. Sin embargo el libro puede ser llevado y leído en cualquier parte.
  • Poca ergonomía: el papel tiene mejor calidad y es un soporte más agradable y confortable que el digital.
  • Uso de distintos sistemas de consulta: El usuario tiene que aprender distintos sistemas si quiere consultar una variedad de títulos.

FUENTES DE INFORMACIÓN

Sistemas de infromación – Las propiedades de la información digital. Codina, Lluís. Retrieved 13:06, July 21, 2010 from http://www.elprofesionaldelainformacion.com/contenidos/2001/diciembre/5.pdf

La publicación electrónica – Dialnet. Retrieved 13:07, July 21, 2010 from
http://dialnet.unirioja.es/servlet/articulo?codigo=1071179

DOCUMENTOS DIGITALES. Retrieved 13:08, July 21, 2010 from
http://www.msinfo.info/propuestas/documentos/documentos_digitales.html

noviembre 1, 2009 at 11:12 pm 1 comentario

Social Bookmarking

Social bookmarking is a method used on the Internet in order to share, organize, search, and manage bookmarks of web resources. Descriptions may be added to these bookmarks in the form of metadata, so that other users do not need to download the content of the resource. Such descriptions may be free text comments, votes in favor of or against its quality, or tags that can become a folksonomy.

Users are able to organize their bookmarks with informal tags instead of the traditional browser-based system of folders by using this social bookmark. They can also view another bookmarks associated with a chosen tag, and include information about the number of users who have bookmarked them. Some social bookmarking services also draw inferences from the relationship of tags to create clusters of tags or bookmarks.

Many social bookmarking services provide web feeds for their lists of bookmarks, including lists organized by tags. This allows subscribers to become aware of new bookmarks as they are saved, shared, and tagged by other users.

On one hand, social bookmarking method has several advantages which are the following:

  • It has search engine spiders that permits people find and bookmark web pages that have not yet been noticed or indexed.
  • All tag-based classification of Internet resources is done by human beings, who understand the content of the resource, as opposed to software, which only determine the meaning of a resource.
  • A social bookmarking system can rank a resource based on how many times it has been bookmarked by users, which may be a more useful metric for end users than systems that rank resources based on the number of external links pointing to it.

On the other hand, social bookmarking also have some disadvantages:

  • There is no standard set of keywords, no standard for the structure of such tags, mistagging due to spelling errors, tags that can have more than one meaning, unclear tags due to synonym/antonym confusion, unorthodox and personalized tag schemata from some users, and no mechanism for users to indicate hierarchical relationships between tags.
  • Social bookmarking can also be susceptible to corruption and collusion as some users have started considering it as a tool to use along with search engine optimization in order to make their website more visible. The more often a web page is submitted and tagged, the better chance it has of being found.
  • Spammers have started bookmarking the same web page multiple times and/or tagging each page of their web site using a lot of popular tags making developers to have to adjust their security system to overcome abuses.

Sources of information

Social bookmarking. (2010, July 20). In Wikipedia, The Free Encyclopedia. Retrieved 11:10, July 21, 2010, from http://en.wikipedia.org/w/index.php?title=Social_bookmarking&oldid=374508287

octubre 22, 2009 at 6:53 pm 3 comentarios

Sobre la traducción automática

La traducción automática (TA), también llamada MT (del inglés Machine Translation), es un área de la lingüística computacional que investiga el uso de software para traducir texto o habla de un lenguaje natural a otro. En un nivel básico, la traducción por ordenador realiza una sustitución simple de las palabras atómicas de un lenguaje natural por las de otro.

En las últimas décadas ha habido un fuerte impulso en el uso de técnicas estadísticas para el desarrollo de sistemas de traducción automática. Para la aplicación de estas técnicas a un par de lenguas dado, se requiere la diponibilidad de un corpus paralelo para dicho par.

La intervención humana puede mejorar la calidad de dicha traducción, por ejemplo, algunos sistemas pueden traducir con mayor exactitud si el usuario identifica previamente las palabras que corresponden a nombres propios. Con la ayuda de estas técnicas, la traducción por ordenador ha mostrado ser un auxiliar útil para los traductores humanos. Sin embargo, los sistemas actuales son incapaces de producir resultados de la misma calidad que un traductor humano, particularmente cuando el texto a traducir usa lenguaje coloquial o familiar. Esto puede comprobarse en traducciones del castellano al catalán, por ejemplo con el traductor translendium donde en palabras como «puesto», el traductor duda si la palabra correcta sería «lloc» o «parada» o la palabra «altura» no está claro si la traducción correcta sería «altura» o «alçaria». Aún así no suele haber grandes problemas en traducir textos procedentes de estos dos idiomas ya que al ser lenguas romances provienen de la misma raiz, en cambio en otros como el inglés que está tipológicamente alejada, suele haber más complicaciones en cuanto a la traducción de sujetos («he», «she» o «it») aparte de otras palabras que pueden producir confusión como «relación» la cual traducida al inglés puede ser «relation» o «relationship».

Debido a estos problemas es mejor tener a mano un buen diccionario y/o un corpus en el lenguaje destino para poder solucionar los problemas de contexto anteriormente citados.

Fuentes:

Colaboradores de Wikipedia. Traducción automática [en línea]. Wikipedia, La enciclopedia libre, 2008 [fecha de consulta: 28 de abril del 2008]. Disponible en <http://es.wikipedia.org/w/index.php?title=Traducci%C3%B3n_autom%C3%A1tica&oldid=16962340>.

May 5, 2008 at 11:09 am Deja un comentario

The main characteristics of a translation task according to the FEMTI report

The Framework for Machine Translation Evaluation in ISLE is a resource that helps MT evaluators define contextual evaluation plans.

FEMTI is made of two interrelated classifications. The first one is used for what the user needs and the second concerns quality characteristics of MT systems which are potentially of interest, along with the metrics that were proposed to measure them.

The characteristics of the translation task are:

  • Assimilation: “the ultimate purpose of the assimilation task (of which translation forms a part) is to monitor a (relatively) large volume of texts produced by people outside the organization, in (usually) several languages”.
  • Dissemination: “the ultimate purpose of dissemination is to deliver to others a translation of documents produced inside the organization”.
  • Communication: “the ultimate purpose of the communication task is to support multi-turn dialogues between people who speak different languages. The translation quality must be high enough for painless conversation, despite possible syntactically ill-formed input and idiosyncratic word and format usage”.

Sources:

The Framework for Machine Translation Evaluation in ISLE, Retrieved April 15, 2008 from http://www.isi.edu/natural-language/mteval/

abril 15, 2008 at 8:05 pm Deja un comentario

Some of European research centres for Human Language Technologies

In my opinion three research centres on Europe which contain suitable information about their work are the following:

  • Language Technology Lab
  • Lengoaia Naturalaren Prozesamendurako IXA Taldea
  • Edinburgh Language Technology Group

I have elected those centres because I think that in their pages they explain their activities and projects in a very concret way. Moreover they have links about some publications which help people to find more information about Human Language Technologies.

IXA Taldea which was created at the University of the Basque Country is promoting the modernization of Basque by means of developing basic computational resources for it. That is an important advance because it would be great that Basque could have more reference pages and more information in as the most of the articles, technology etc is usually available only in English.

Apart of that group the other centres contain such an inportant work in techniques of Human Language Technologies, an example of that is Language Technology Lab that is very well organizated and also Edinburgh Language Technology Group. 

abril 1, 2008 at 9:39 pm Deja un comentario

Who is Hans Uszkoreit?

Hans Uszkoreit is a computational linguistic in Saarbrücken, Germany. He is working as professor at Saarland University and as scientific director at the German Research Center for Artificial intelligence (DKI) where he is the head of the newly founded Language Technology Lab. He is also co-founder and professor of the «European Postgraduate Program Language Technology and Cognitive Systems» . Apart of them he is also member of many other associations, academies etc.

He is interested in computer models of natural language understanding and production, advanced applications of language and knowledge technologies, for example grammar formalisms and their implementation.

His most recently publications are the following:

Uszkoreit, H. (2007) Methods and Applications for Relation Detection. In: Proceedings of the Third IEEE International Conference on Natural Language Processing and Knowledge Engineering, Beijing, 2007.

Uszkoreit, H. F. Xu, W. Liu (2007) Challenges and Solutions of Multilingual and Translingual Information Service Systems, To appear in Proceedings of HCI International 2007, 12th International Conference on Human-Computer Interaction, Beijing, 2007.

Uszkoreit, H., F. Xu, Weiquan Liu, J. Steffen, I. Aslan, J. Liu, C. Müller, B. Holtkamp, M. Wojciechowski (2007)
A Successful Field Test of a Mobile and Multilingual Information Service System COMPASS2008. In Proceedings of HCI International 2007, 12th International Conference on Human-Computer Interaction, Beijing, 2007.

H. Uszkoreit, H. Li (2007) A Seed-driven Bottom-up Machine Learning Framework for Extracting Relations of Various Complexity, To appear in: Proceedings of ACL 07, Annual Meeting of the Association of Computational Linguistics, Prague 2007.

Sources:

Hans Uszkoreit (2008). Retrieved 1st April from http://hans.uszkoreit.net/

abril 1, 2008 at 7:17 pm Deja un comentario

About CLARIN

CLARIN (Common Language Resources and Technology Infrastucture) is a research infrastructure of language resources and its technology.

It offers some services to the different communities of linguists, the humanities scholars and to the society.

The mission of CLARIN to create a Pan European infrastructure that will boost humanities research in a multicultural and multilingual area as Europe is and facilitate a multilingual and multicultural education in schools, colleges and universities.

By language resources and its technology they mean all knowledge sources based on written or spoken language and the tools to carry out operations on such language material. There are some characteristics about what CLARIN language resources and technologies are:

  • Texts of all sorts which can be digitized medieval sources, web-sites, newspapers, digitized books etc.
  • Multimedia recordings (audio/video) and time series recorded during communication like data glove or eye tracking.
  • Various types of manually or automatically created annotations on texts, media streams etc.
  • Tools such as aligners, speech recognizers, tokenizers, part-of-speech taggers, parsers, manual annotators, viewers etc.
  • Various types of knowledge sources encapsulating knowledge about resources and languages such as metadata descriptions, GIS, lexica, concept registries, ontologies etc.

The Language Resource and Technology community is working on the content of the resources and apply specific tools tailored to their research interests, the language resource community is interested in linguistic content, structures, formal semantics etc.

Sources:

Common Language Resources and Technology Infraestructure (CLARIN). (2008). Retrieved March 31, 2008 from http://www.clarin.eu/

    marzo 31, 2008 at 10:49 am 1 comentario

    Older Posts


    Páginas

    May 2024
    L M X J V S D
     12345
    6789101112
    13141516171819
    20212223242526
    2728293031  

    RSS Feed desconocido

    • Se ha producido un error; es probable que la fuente esté fuera de servicio. Vuelve a intentarlo más tarde.

    bookmarks

    Entradas recientes

    Categorías