Building and Exploring Web Corpora. Proceedings of the 3rd web as corpus workshop, incorporating cleaneval

Name: Building and Exploring Web Corpora
Price: 19.7 EUR
Availability: InStock
Author: Cédrick Fairon
ISBN: 978-2-87463-082-8

Par : Cédrick Fairon, Hubert Naets, Adam Kilgarriff, Gilles-Maurice de Schryver

Formats :

19,70 €

Paiement en ligne :
- Livraison à domicile ou en point Mondial Relay entre le 10 juillet et le 22 juillet
  Cet article doit être commandé chez un fournisseur. Votre colis vous sera expédié 8 à 17 jours après la date de votre commande.
- Retrait Click and Collect en magasin gratuit

Nombre de pages182
PrésentationBroché
Poids0.51 kg
Dimensions16,0 cm × 24,0 cm × 1,0 cm
ISBN978-2-87463-082-8
EAN9782874630828
Date de parution01/01/2007
CollectionCahiers du CENTAL
ÉditeurPresses Universitaires Louvain

Résumé

WAC More and more people are using Web data for linguistic and NLP research. The Web as Corpusworkshop (WAC) provides a venue for exploring how we can use it effectively and the advancementsto which this could lead. This book is a collection of the talks presented at the 3 rd WAC in Louvain-la-Neuve (Belgium). The focus is on the description of Web corpus collection projects, the exploration of Web datacharacteristics from a linguistics/NLP perspective, and on the use of crawled Web data for NLPpurposes.
CLEANEVAL Any use of Web data requires that it be cleaned in order to get rid of unwanted material including, for example, HTML markup, navigation bars, advertisements. To date there has been no sharingof resources or expertise in this particular domain and the cleaning has often been done minimally. Cleaneval was an exercise aimed at promoting collaboration and improving our understandingof the issues.
Results and perspectives are presented in this book.

A propos de Cédrick Fairon

Découvrir l'auteur

Le petit bon usage de la langue française. Grammaire
2e édition

Cédrick Fairon, Anne-Catherine Simon, Maurice Grevisse

Grand Format

29,90 €

Le petit bon usage de la langue française. Grammaire
2e édition

Cédrick Fairon, Anne-Catherine Simon, Maurice Grevisse

E-book

22,99 €

Le petit bon usage de la langue française. Grammaire
2e édition

Cédrick Fairon, Anne-Catherine Simon, Maurice Grevisse

E-book

22,99 €

Actualité de l'humanisme. Libres héritiers de la Renaissance

Marco Cavalieri, Nuccio Ordine

E-book

9,99 €

Actualité de l'humanisme. Libres héritiers de la Renaissance

Marco Cavalieri, Nuccio Ordine

Grand Format

21,00 €

Building and Exploring Web Corpora. Proceedings of the 3rd web as corpus workshop, incorporating cleaneval

Formats :

Résumé

A propos de Cédrick Fairon

Le petit bon usage de la langue française. Grammaire
2e édition

Le petit bon usage de la langue française. Grammaire
2e édition

Le petit bon usage de la langue française. Grammaire
2e édition

Actualité de l'humanisme. Libres héritiers de la Renaissance

Actualité de l'humanisme. Libres héritiers de la Renaissance

Language and the new (instant) media

Les tables : la grammaire de français par le menu. Mélanges en hommage à Christian Leclère
Edition 2010

SMS pour la science (licence : de 11 à 25 utilisateurs, manuel+CD-Rom). Corpus de 30.000 SMS et logiciel de consultation

SMS pour la science (licence : de 2 à 10 utilisateurs, manuel+CD-Rom). Corpus de 30.000 SMS et logiciel de consultation

Verbum ex machina. Actes de la 13e conférence sur le traitement automatique des langues naturelles, Tome 1

Verbum ex machina. Actes de la 13e conférence sur le traitement automatique des langues naturelles, Tome 2

Le langage SMS. Etude d'un corpus informatisé à partir de l'enquête "Faites don de vos SMS à la science"

SMS pour la science. Corpus de 30000 sms et logiciel de consultation
avec 1 Cédérom

Le poids des mots. Actes des 7èmes journées internationales d'analyse statistique des données textuelles, Volume 1

Le poids des mots. Actes des 7èmes journées internationales d'analyse statistique des données textuelles, Volume 2

Building and Exploring Web Corpora. Proceedings of the 3rd web as corpus workshop, incorporating cleaneval

Formats :

Résumé

A propos de Cédrick Fairon

Le petit bon usage de la langue française. Grammaire2e édition

Le petit bon usage de la langue française. Grammaire2e édition

Le petit bon usage de la langue française. Grammaire2e édition

Actualité de l'humanisme. Libres héritiers de la Renaissance

Actualité de l'humanisme. Libres héritiers de la Renaissance

Language and the new (instant) media

Les tables : la grammaire de français par le menu. Mélanges en hommage à Christian Leclère Edition 2010

SMS pour la science (licence : de 11 à 25 utilisateurs, manuel+CD-Rom). Corpus de 30.000 SMS et logiciel de consultation

SMS pour la science (licence : de 2 à 10 utilisateurs, manuel+CD-Rom). Corpus de 30.000 SMS et logiciel de consultation

Verbum ex machina. Actes de la 13e conférence sur le traitement automatique des langues naturelles, Tome 1

Verbum ex machina. Actes de la 13e conférence sur le traitement automatique des langues naturelles, Tome 2

Le langage SMS. Etude d'un corpus informatisé à partir de l'enquête "Faites don de vos SMS à la science"

SMS pour la science. Corpus de 30000 sms et logiciel de consultation avec 1 Cédérom

Le poids des mots. Actes des 7èmes journées internationales d'analyse statistique des données textuelles, Volume 1

Le poids des mots. Actes des 7èmes journées internationales d'analyse statistique des données textuelles, Volume 2

Le petit bon usage de la langue française. Grammaire
2e édition

Le petit bon usage de la langue française. Grammaire
2e édition

Le petit bon usage de la langue française. Grammaire
2e édition

Les tables : la grammaire de français par le menu. Mélanges en hommage à Christian Leclère
Edition 2010

SMS pour la science. Corpus de 30000 sms et logiciel de consultation
avec 1 Cédérom