Re: Bokstavsfrekvenser i svenskan

Författare: Christian Rose (menthos_at_menthos.com)
Datum: 2004-02-20 16:05:40

ons 2004-02-18 klockan 23.10 skrev Christian Rose:
> Till översättningen av GNOME behöver jag statistik över normala
> bokstavsförekomster i svenskan.

Ok, jag fick svar från min gamla exjobbshandledare i kryptoteknik, som i
sin tur citerade någon språkstatistik från det svenska försvaret från år
1938:

        Svensk språkstatistik från 1938 i %:

        a 9.7
        b 1.1
        c 1.2
        d 5.1
        e 9.3
        f 2.2
        g 3.3
        h 2.0
        i 5.4
        j 0.5
        k 2.9
        l 5.6
        m 3.5
        n 9.1
        o 3.9
        p 1.6
        q -
        r 7.8
        s 5.9
        t 8.9
        u 1.9
        v 2.7
        w -
        x -
        y 0.5
        z -
        å 1.9
        ä 2.5
        ö 1.5


Sorterat efter förekomstfrekvens blir det alltså:

        a 9.7
        e 9.3
        n 9.1
        t 8.9
        r 7.8
        s 5.9
        l 5.6
        i 5.4
        d 5.1
        o 3.9
        m 3.5
        g 3.3
        k 2.9
        v 2.7
        ä 2.5
        f 2.2
        h 2.0
        u 1.9
        å 1.9
        p 1.6
        ö 1.5
        c 1.2
        b 1.1
        j 0.5
        y 0.5
        q -
        w -
        x -
        z -

Detta blir alltså det jag kommer att använda i den svenska
översättningen av GOK.


Christian


_______________________________________________
sv mailing list
sv@li.org
http://lists.alt.org/mailman/listinfo/sv

Arkiv genererat av hypermail pre-2.1.8.