|
View:
New views
5 Messages
—
Rating Filter:
Alert me
|
|
|
Change log - bèta versie 1.10GDag allen,
Ik heb een diff gedaan tussen de huidige basiswoordenlijst en de nieuwe basiswoordenlijst. Het gaat om de bestanden: "basiswoorden290507-utf8.txt"[1] en "basiswoorden070608-utf8.txt"[2] (zoals ontvangen van Kurt). Bijgaand het resultaat in de vorm van een change log. Ik heb iedere wijziging becommentarieerd en bij een aantal wijzigingen heb ik vraagtekens (query "#?#"). Daarnaast heb ik de volgende opmerkingen: - Volgens mij hebben we niet alle wijzigingsverzoeken uit de Google-sheet verwerkt, zoals bijvoorbeeld "dolfijnen-" (zie: http://spreadsheets.google.com/pub?key=pP28Lt93l_6Ek4BCm1bE6Ig ). We moeten deze nauwkeurig doornemen en verwerken, voordat we een nieuwe versie van de woordenlijst uitbrengen. - We hebben ook nog niet alle errata van de NTu verwerkt (zie: http://woordenlijst.org/erratalijst/ ). Zo staat in onze woordenlijst palmzondag, terwijl het Palmzondag moet zijn. Ook deze wijzigingen moeten we nogmaals nauwkeurig doorlopen. [1] zie: http://opentaal.nl/download.php?file=/bestanden/bronbestanden-100G.zip [2] zie: http://www.opentaal.org/bestanden/woordenlijst110G/wordlist-1.10.tar.gz -- Vriendelijke groet, Bart Knubben | http://www.knubben.org | http://www.opentaal.org | > http://www.minmen.nl - Een blog over de impact van het Internet op onze maatschappij en publieke sector < baknu@baknu-laptop:~$ diff Bureaublad/basiswoorden070608-utf8.txt Bureaublad/basiswoorden290507-utf8.txt 1c1 < 's Gravenbrakel --- > 's Gravenbrakel #Gecorrigeerd, want apostrof had verkeerde charactercode 460a461 > Apachedans #Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/). #?#Waarom niet "apachedans" toegevoegd? 1139a1141,1142 > Boekenweekessay > Boekenweekgeschenk #Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/) #?#Waarom niet "boekenweekessay" en "boekenweekgeschenk" toegevoegd? 6800a6804 > Riziv #Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/) #?#Waarom niet "RIZIV" toegevoegd? 8774a8779 > wilde Westen #?#Verwijderd, want onbekende reden? 35453a35459 > docentencorps #Verwijderd, want foutspelling (zie: http://woordenlijst.org/zoek/?q=docentenkorps) #"docentenkorps" was reeds opgenomen. 37314a37321 > drietrapsrakket #Verwijderd, want foutspelling (zie: http://woordenlijst.org/zoek/?q=drietrapsraket) #"drietrapsraket" was reeds opgenomen. 46783a46791 > genua #Verwijderd, want foutspelling. Het moet zijn: Genua #"Genua" was reeds opgenomen. 63600a63609 > kiezerscorps #Verwijderd, want foutspelling (zie: http://woordenlijst.org/zoek/?q=kiezerskorps) #"kiezerskorps" was reeds opgenomen. 66281a66291 > kompleet #Verwijderd, want foutspelling. Het moet zijn: compleet #"compleet" was reeds opgenomen. 76454a76465 > melen #Verwijderd, wel correcte spelling maar verwarrend t.o.v. "mailen". #?#Zijn de flexievormen (meelt, meelde, meelden, gemeeld etc.) nu ook verwijderd? 81198a81210 > neestemmer #Verwijderd, want foutspelling. (zie: http://woordenlijst.org/erratalijst/) #?#Waarom niet "nee-stemmer" toegevoegd? 92914a92927 > perscorps #Verwijderd, want foutspelling. #"perskorps" was reeds opgenomen. 95033a95047 > politiecordon #Verwijderd, want foutspelling (http://woordenlijst.org/zoek/?q=politiekordon) #"politiekordon" was reeds opgenomen. 103835a103850,103851 > rummikub > rummikuppen #Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/). #?#Wat doen we met de nieuwe variant "Rummikub®"? 125460a125477,125478 > van zinnens zijn #Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/). #?#Waarom niet "zinnens zijn" toegevoegd? > van zins zijn #Deze uitdrukking is onterecht verwijderd (zie: http://woordenlijst.org/erratalijst/). #?#Waarom niet behouden? 138130a138149 > wij-zijgevoel #Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/) #?#Waarom niet "wij-zij-gevoel" toegevoegd? 139744a139764 > xerox #Verwijderd, want foutspelling - zie: http://woordenlijst.org/erratalijst/ #?#Wat doen we met de nieuwe variant "xeroxâ¢"? _______________________________________________ Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php Juridische voorwaarden: http://opentaal.org/licentie.php |
|
|
Re: Change log - bèta versie 1.10GOn Wed, Jun 11, 2008 at 12:31:17AM +0200, Bart Knubben wrote:
> 1c1 > < 's Gravenbrakel > --- > > ???'s Gravenbrakel > #Gecorrigeerd, want apostrof had verkeerde charactercode Er stond een Byte Order Mark (BOM) in de oude file die niet in de nieuwe stond. Hier is dus niet aan veranderd. Kurt _______________________________________________ Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php Juridische voorwaarden: http://opentaal.org/licentie.php |
|
|
Re: Change log - bèta versie 1.10GBart Knubben schreef: Dag allen, Ik heb een diff gedaan tussen de huidige basiswoordenlijst en de nieuwe basiswoordenlijst. Het gaat om de bestanden: "basiswoorden290507-utf8.txt"[1] en "basiswoorden070608-utf8.txt"[2] (zoals ontvangen van Kurt). Bijgaand het resultaat in de vorm van een change log. Ik heb iedere wijziging becommentarieerd en bij een aantal wijzigingen heb ik vraagtekens (query "#?#"). Daarnaast heb ik de volgende opmerkingen: - Volgens mij hebben we niet alle wijzigingsverzoeken uit de Google-sheet verwerkt, zoals bijvoorbeeld "dolfijnen-" (zie: http://spreadsheets.google.com/pub?key=pP28Lt93l_6Ek4BCm1bE6Ig ). We moeten deze nauwkeurig doornemen en verwerken, voordat we een nieuwe versie van de woordenlijst uitbrengen. - We hebben ook nog niet alle errata van de NTu verwerkt (zie: http://woordenlijst.org/erratalijst/ ). Zo staat in onze woordenlijst palmzondag, terwijl het Palmzondag moet zijn. Ook deze wijzigingen moeten we nogmaals nauwkeurig doorlopen. [1] zie: http://opentaal.nl/download.php?file=/bestanden/bronbestanden-100G.zip [2] zie: http://www.opentaal.org/bestanden/woordenlijst110G/wordlist-1.10.tar.gz _______________________________________________ Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php Juridische voorwaarden: http://opentaal.org/licentie.php |
|
|
Re: Change log - bèta versie 1.10GDag Ruud,
Je opmerking begrijp ik niet. Graag een toelichting... Groet, Bart Op 11-06-08 heeft r.baars<r.j.baars@...> het volgende geschreven: > Goed dat de functie om ze eruit te halen er is ... > > Bart Knubben schreef: >> Dag allen, >> >> Ik heb een diff gedaan tussen de huidige basiswoordenlijst en de >> nieuwe basiswoordenlijst. Het gaat om de bestanden: >> "basiswoorden290507-utf8.txt"[1] en "basiswoorden070608-utf8.txt"[2] >> (zoals ontvangen van Kurt). Bijgaand het resultaat in de vorm van een >> change log. Ik heb iedere wijziging becommentarieerd en bij een aantal >> wijzigingen heb ik vraagtekens (query "#?#"). >> >> Daarnaast heb ik de volgende opmerkingen: >> - Volgens mij hebben we niet alle wijzigingsverzoeken uit de >> Google-sheet verwerkt, zoals bijvoorbeeld "dolfijnen-" (zie: >> http://spreadsheets.google.com/pub?key=pP28Lt93l_6Ek4BCm1bE6Ig ). We >> moeten deze nauwkeurig doornemen en verwerken, voordat we een nieuwe >> versie van de woordenlijst uitbrengen. >> - We hebben ook nog niet alle errata van de NTu verwerkt (zie: >> http://woordenlijst.org/erratalijst/ ). Zo staat in onze woordenlijst >> palmzondag, terwijl het Palmzondag moet zijn. Ook deze wijzigingen >> moeten we nogmaals nauwkeurig doorlopen. >> >> [1] zie: >> http://opentaal.nl/download.php?file=/bestanden/bronbestanden-100G.zip >> [2] zie: >> http://www.opentaal.org/bestanden/woordenlijst110G/wordlist-1.10.tar.gz >> >> ------------------------------------------------------------------------ >> >> _______________________________________________ >> Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php >> Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php >> Juridische voorwaarden: http://opentaal.org/licentie.php > > -- Vriendelijke groet, Bart Knubben | http://www.knubben.org | http://www.opentaal.org | > http://www.minmen.nl - Een blog over de impact van het Internet op onze maatschappij en publieke sector < _______________________________________________ Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php Juridische voorwaarden: http://opentaal.org/licentie.php |
|
|
Re: Change log - bèta versie 1.10GHoi Bart, allen,
Bart Knubben schreef: > Dag allen, > > Ik heb een diff gedaan tussen de huidige basiswoordenlijst en de > nieuwe basiswoordenlijst. Het gaat om de bestanden: > "basiswoorden290507-utf8.txt"[1] en "basiswoorden070608-utf8.txt"[2] > (zoals ontvangen van Kurt). Bijgaand het resultaat in de vorm van een > change log. Ik heb iedere wijziging becommentarieerd en bij een aantal > wijzigingen heb ik vraagtekens (query "#?#"). > > Daarnaast heb ik de volgende opmerkingen: > - Volgens mij hebben we niet alle wijzigingsverzoeken uit de > Google-sheet verwerkt, zoals bijvoorbeeld "dolfijnen-" (zie: > http://spreadsheets.google.com/pub?key=pP28Lt93l_6Ek4BCm1bE6Ig ). We > moeten deze nauwkeurig doornemen en verwerken, voordat we een nieuwe > versie van de woordenlijst uitbrengen. > Het gaat om (tussen haakjes de juiste vorm volgens de officiële spellingregels) gedachtenstappen (gedachtestappen) gedachtenwendingen (gedachtewendingen) getuigeverklaringen (getuigenverklaringen) opgaveverplichtingen (opgavenverplichtingen) rogge-aren (roggearen) zieleroerselen (zielenroerselen) ziektenkostenregelingen (ziektekostenregelingen) ict-bedrijven (ICT-bedrijven) housde (housede) koranscholen (Koranscholen) -- Vriendelijke groet, Simon Brouwer. | http://nl.openoffice.org | http://www.opentaal.org | _______________________________________________ Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php Juridische voorwaarden: http://opentaal.org/licentie.php |
| Free Forum Powered by Nabble | Forum Help |