Change log - bèta versie 1.10G

View: New views
5 Messages — Rating Filter:   Alert me  

Change log - bèta versie 1.10G

by Bart Knubben :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Dag allen,

Ik heb een diff gedaan tussen de huidige basiswoordenlijst en de
nieuwe basiswoordenlijst. Het gaat om de bestanden:
"basiswoorden290507-utf8.txt"[1] en "basiswoorden070608-utf8.txt"[2]
(zoals ontvangen van Kurt). Bijgaand het resultaat in de vorm van een
change log. Ik heb iedere wijziging becommentarieerd en bij een aantal
wijzigingen heb ik vraagtekens (query "#?#").

Daarnaast heb ik de volgende opmerkingen:
- Volgens mij hebben we niet alle wijzigingsverzoeken uit de
Google-sheet verwerkt, zoals bijvoorbeeld "dolfijnen-"  (zie:
http://spreadsheets.google.com/pub?key=pP28Lt93l_6Ek4BCm1bE6Ig ). We
moeten deze nauwkeurig doornemen en verwerken, voordat we een nieuwe
versie van de woordenlijst uitbrengen.
-  We hebben ook nog niet alle errata van de NTu verwerkt (zie:
http://woordenlijst.org/erratalijst/ ). Zo staat in onze woordenlijst
palmzondag, terwijl het Palmzondag moet zijn. Ook deze wijzigingen
moeten we nogmaals nauwkeurig doorlopen.

[1] zie: http://opentaal.nl/download.php?file=/bestanden/bronbestanden-100G.zip
[2] zie: http://www.opentaal.org/bestanden/woordenlijst110G/wordlist-1.10.tar.gz
--
Vriendelijke groet,
Bart Knubben

| http://www.knubben.org | http://www.opentaal.org |

> http://www.minmen.nl - Een blog over de impact van het Internet op onze maatschappij en publieke sector <

baknu@baknu-laptop:~$ diff Bureaublad/basiswoorden070608-utf8.txt Bureaublad/basiswoorden290507-utf8.txt

1c1
< 's Gravenbrakel
---
> 's Gravenbrakel
#Gecorrigeerd, want apostrof had verkeerde charactercode

460a461
> Apachedans
#Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/).
#?#Waarom niet "apachedans" toegevoegd?

1139a1141,1142
> Boekenweekessay
> Boekenweekgeschenk
#Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/)
#?#Waarom niet "boekenweekessay" en "boekenweekgeschenk" toegevoegd?

6800a6804
> Riziv
#Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/)
#?#Waarom niet "RIZIV" toegevoegd?

8774a8779
> wilde Westen
#?#Verwijderd, want onbekende reden?

35453a35459
> docentencorps
#Verwijderd, want foutspelling (zie: http://woordenlijst.org/zoek/?q=docentenkorps)
#"docentenkorps" was reeds opgenomen.

37314a37321
> drietrapsrakket
#Verwijderd, want foutspelling (zie: http://woordenlijst.org/zoek/?q=drietrapsraket)
#"drietrapsraket" was reeds opgenomen.

46783a46791
> genua
#Verwijderd, want foutspelling. Het moet zijn: Genua
#"Genua" was reeds opgenomen.

63600a63609
> kiezerscorps
#Verwijderd, want foutspelling (zie: http://woordenlijst.org/zoek/?q=kiezerskorps)
#"kiezerskorps" was reeds opgenomen.

66281a66291
> kompleet
#Verwijderd, want foutspelling. Het moet zijn: compleet
#"compleet" was reeds opgenomen.

76454a76465
> melen
#Verwijderd, wel correcte spelling maar verwarrend t.o.v. "mailen".
#?#Zijn de flexievormen (meelt, meelde, meelden, gemeeld etc.) nu ook verwijderd?

81198a81210
> neestemmer
#Verwijderd, want foutspelling. (zie: http://woordenlijst.org/erratalijst/)
#?#Waarom niet "nee-stemmer" toegevoegd?

92914a92927
> perscorps
#Verwijderd, want foutspelling.
#"perskorps" was reeds opgenomen.

95033a95047
> politiecordon
#Verwijderd, want foutspelling (http://woordenlijst.org/zoek/?q=politiekordon)
#"politiekordon" was reeds opgenomen.

103835a103850,103851
> rummikub
> rummikuppen
#Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/).
#?#Wat doen we met de nieuwe variant "Rummikub®"?

125460a125477,125478
> van zinnens zijn
#Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/).
#?#Waarom niet "zinnens zijn" toegevoegd?

> van zins zijn
#Deze uitdrukking is onterecht verwijderd (zie: http://woordenlijst.org/erratalijst/).
#?#Waarom niet behouden?

138130a138149
> wij-zijgevoel
#Verwijderd, want foutspelling (zie: http://woordenlijst.org/erratalijst/)
#?#Waarom niet "wij-zij-gevoel" toegevoegd?

139744a139764
> xerox
#Verwijderd, want foutspelling - zie: http://woordenlijst.org/erratalijst/
#?#Wat doen we met de nieuwe variant "xerox™"?

_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

Re: Change log - bèta versie 1.10G

by Kurt Roeckx :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

On Wed, Jun 11, 2008 at 12:31:17AM +0200, Bart Knubben wrote:
> 1c1
> < 's Gravenbrakel
> ---
> > ???'s Gravenbrakel
> #Gecorrigeerd, want apostrof had verkeerde charactercode

Er stond een Byte Order Mark (BOM) in de oude file die niet in de nieuwe
stond.  Hier is dus niet aan veranderd.


Kurt


_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

Re: Change log - bèta versie 1.10G

by r.baars :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Goed dat de functie om ze eruit te halen er is ...

Bart Knubben schreef:
Dag allen,

Ik heb een diff gedaan tussen de huidige basiswoordenlijst en de
nieuwe basiswoordenlijst. Het gaat om de bestanden:
"basiswoorden290507-utf8.txt"[1] en "basiswoorden070608-utf8.txt"[2]
(zoals ontvangen van Kurt). Bijgaand het resultaat in de vorm van een
change log. Ik heb iedere wijziging becommentarieerd en bij een aantal
wijzigingen heb ik vraagtekens (query "#?#").

Daarnaast heb ik de volgende opmerkingen:
- Volgens mij hebben we niet alle wijzigingsverzoeken uit de
Google-sheet verwerkt, zoals bijvoorbeeld "dolfijnen-"  (zie:
http://spreadsheets.google.com/pub?key=pP28Lt93l_6Ek4BCm1bE6Ig ). We
moeten deze nauwkeurig doornemen en verwerken, voordat we een nieuwe
versie van de woordenlijst uitbrengen.
-  We hebben ook nog niet alle errata van de NTu verwerkt (zie:
http://woordenlijst.org/erratalijst/ ). Zo staat in onze woordenlijst
palmzondag, terwijl het Palmzondag moet zijn. Ook deze wijzigingen
moeten we nogmaals nauwkeurig doorlopen.

[1] zie: http://opentaal.nl/download.php?file=/bestanden/bronbestanden-100G.zip
[2] zie: http://www.opentaal.org/bestanden/woordenlijst110G/wordlist-1.10.tar.gz
  

_______________________________________________ Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php Juridische voorwaarden: http://opentaal.org/licentie.php


_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

Re: Change log - bèta versie 1.10G

by Bart Knubben :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Dag Ruud,
Je opmerking begrijp ik niet. Graag een toelichting...
Groet, Bart

Op 11-06-08 heeft r.baars<r.j.baars@...> het volgende geschreven:

> Goed dat de functie om ze eruit te halen er is ...
>
> Bart Knubben schreef:
>> Dag allen,
>>
>> Ik heb een diff gedaan tussen de huidige basiswoordenlijst en de
>> nieuwe basiswoordenlijst. Het gaat om de bestanden:
>> "basiswoorden290507-utf8.txt"[1] en "basiswoorden070608-utf8.txt"[2]
>> (zoals ontvangen van Kurt). Bijgaand het resultaat in de vorm van een
>> change log. Ik heb iedere wijziging becommentarieerd en bij een aantal
>> wijzigingen heb ik vraagtekens (query "#?#").
>>
>> Daarnaast heb ik de volgende opmerkingen:
>> - Volgens mij hebben we niet alle wijzigingsverzoeken uit de
>> Google-sheet verwerkt, zoals bijvoorbeeld "dolfijnen-"  (zie:
>> http://spreadsheets.google.com/pub?key=pP28Lt93l_6Ek4BCm1bE6Ig ). We
>> moeten deze nauwkeurig doornemen en verwerken, voordat we een nieuwe
>> versie van de woordenlijst uitbrengen.
>> -  We hebben ook nog niet alle errata van de NTu verwerkt (zie:
>> http://woordenlijst.org/erratalijst/ ). Zo staat in onze woordenlijst
>> palmzondag, terwijl het Palmzondag moet zijn. Ook deze wijzigingen
>> moeten we nogmaals nauwkeurig doorlopen.
>>
>> [1] zie:
>> http://opentaal.nl/download.php?file=/bestanden/bronbestanden-100G.zip
>> [2] zie:
>> http://www.opentaal.org/bestanden/woordenlijst110G/wordlist-1.10.tar.gz
>>
>> ------------------------------------------------------------------------
>>
>> _______________________________________________
>> Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
>> Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
>> Juridische voorwaarden: http://opentaal.org/licentie.php
>
>

--
Vriendelijke groet,
Bart Knubben

| http://www.knubben.org | http://www.opentaal.org |

> http://www.minmen.nl - Een blog over de impact van het Internet op onze maatschappij en publieke sector <

_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php

Re: Change log - bèta versie 1.10G

by Simon Brouwer :: Rate this Message:

Reply to Author | View Threaded | Show Only this Message

Hoi Bart, allen,

Bart Knubben schreef:

> Dag allen,
>
> Ik heb een diff gedaan tussen de huidige basiswoordenlijst en de
> nieuwe basiswoordenlijst. Het gaat om de bestanden:
> "basiswoorden290507-utf8.txt"[1] en "basiswoorden070608-utf8.txt"[2]
> (zoals ontvangen van Kurt). Bijgaand het resultaat in de vorm van een
> change log. Ik heb iedere wijziging becommentarieerd en bij een aantal
> wijzigingen heb ik vraagtekens (query "#?#").
>
> Daarnaast heb ik de volgende opmerkingen:
> - Volgens mij hebben we niet alle wijzigingsverzoeken uit de
> Google-sheet verwerkt, zoals bijvoorbeeld "dolfijnen-"  (zie:
> http://spreadsheets.google.com/pub?key=pP28Lt93l_6Ek4BCm1bE6Ig ). We
> moeten deze nauwkeurig doornemen en verwerken, voordat we een nieuwe
> versie van de woordenlijst uitbrengen.
>  
Ik heb nog een paar correcties, kunnen die meteen mee?
Het gaat om (tussen haakjes de juiste vorm volgens de officiële
spellingregels)

gedachtenstappen (gedachtestappen)
gedachtenwendingen (gedachtewendingen)
getuigeverklaringen (getuigenverklaringen)
opgaveverplichtingen (opgavenverplichtingen)
rogge-aren (roggearen)
zieleroerselen (zielenroerselen)
ziektenkostenregelingen (ziektekostenregelingen)
ict-bedrijven (ICT-bedrijven)
housde (housede)
koranscholen (Koranscholen)


--
Vriendelijke groet,
Simon Brouwer.

| http://nl.openoffice.org | http://www.opentaal.org |

_______________________________________________
Over de OpenTaal-mailinglist: http://opentaal.org/mailinglist.php
Zoeken in het mailinglistarchief: http://opentaal.org/zoeken.php
Juridische voorwaarden: http://opentaal.org/licentie.php
LightInTheBox - Buy quality products at wholesale price