atarionline.pl Action! (+ benchmarks comparision) - Forum Atarum

Jeśli chcesz wziąć udział w dyskusjach na forum - zaloguj się. Jeżeli nie masz loginu - poproś o członkostwo.

  • :
  • :

Vanilla 1.1.4 jest produktem Lussumo. Więcej informacji: Dokumentacja, Forum.

    • 1: CommentAuthorurborg
    • CommentTime24 Feb 2020
     
    @zbyti
    Zoptymalizowałem lekko ten program w basicu :)
    • 2: CommentAuthorzbyti
    • CommentTime24 Feb 2020 zmieniony
     
    @urborg nieźle! :]

    A wrzucisz jeszcze wyniki dla Turbo-BASIC XL w wersji skompilowanej i bez kompilacji?

    Wtedy podbiję tabelkę :]
    • 3: CommentAuthorxxl
    • CommentTime24 Feb 2020
     
    no ale skoro optymalizowac to zamiast:

    f.i=1to8191:flag$(i,i)="T":n.i

    prosze zapisac:

    flag$="T":flag$(8191)=flag$:flag$(2)=flag$

    zdaje sie od zawsze ten trik dziala...
    • 4: CommentAuthorzbyti
    • CommentTime24 Feb 2020 zmieniony
     
    @xxl zaraz to przetestuję.

    Na razie w Turbo-BASIC XL mam takie wyniki jak na obrazkach. Drugi listing to kod na wzór tego co zrobiłem w Quick nie mając tam tablic.

    Umiem kod skompilować w TB ale nie potrafię za pomocą tego co pobrałem z netu użyć linkera. Wiec wyniki dla wersji nieskompilowanej.

    Skoro idziemy na szybkość to do tabelki pójdzie dla BASIC i TB kod z POKE&PEEK.

    Jak ktoś umie to linkować to kod na dyskietce w załączniku.
    • 5: CommentAuthorzbyti
    • CommentTime24 Feb 2020 zmieniony
     
    Czysty BASIC po przejściu z dwuymiarowej tablicy na Poke&Peek. Chyba taką innowację miał na myśli autor wspomnianego art. że napisał że można szybciej.

    Sądzę, że któraś z osób śledzących ten wątek potrafi jeszcze szybciej w samym BASIC-u.

    CC65           YoshPlus:   41844 iterations in 100 ticks
    Mad Pascal YoshPlus: 35572 iterations in 100 ticks
    Action! YoshPlus: 33239 iterations in 100 ticks
    Quick 2.2 YoshPlus: 21320 iterations in 100 ticks
    Quick 1.6 YoshPlus: 16242 iterations in 100 ticks
    PL65 YoshPlus: 4708 iterations in 100 ticks
    FastBasic FBI YoshPlus: 2427 iterations in 100 ticks
    fig-Forth 1.1 YoshPlus: 715 iterations in 100 ticks
    CLSN Pascal YoshPlus: 487 iterations in 100 ticks

    CC65 Chessboard: 76 iterations in 150 ticks
    Mad Pascal Chessboard: 40 iterations in 150 ticks
    Action! Chessboard: 35 iterations in 150 ticks
    Quick 2.2 Chessboard: 27 iterations in 150 ticks
    Quick 1.6 Chessboard: 16 iterations in 150 ticks
    PL65 Chessboard: 12 iterations in 150 ticks

    MADS (opt) SIEVE: 440 ticks in 10 iterations
    CC65 (opt) SIEVE: 602 ticks in 10 iterations
    Mad Pascal (opt) SIEVE: 644 ticks in 10 iterations
    Mad Pascal SIEVE: 739 ticks in 10 iterations
    Action! SIEVE: 1003 ticks in 10 iterations
    Quick 1.6 SIEVE: 2022 ticks in 10 iterations
    Quick 2.2 SIEVE: 2199 ticks in 10 iterations
    PL65 SIEVE: 3853 ticks in 10 iterations
    FastBasic FBI SIEVE: 6312 ticks in 10 iterations
    fig-Forth 1.1 SIEVE: 8482 ticks in 10 iterations
    Turbo-BASIC XL SIEVE: 64000 ticks in 10 iterations
    BASIC SIEVE: 170700 ticks in 10 iterations
    • 6: CommentAuthorzbyti
    • CommentTime24 Feb 2020 zmieniony
     
    OK. Udało mi się użyć linkera do Turbo-BASIC XL. Trochę się naszukałem "czegoś" co działa "po ludzku" ;)

    No to ostateczne wyniki. Każdy inny to już jak ktoś przeprowadzi własne testy.

    Wyniki dla TB tak jak dla BASIC jeden przebieg x10.

    Skończyłem zabawę :]

    EDIT:
    Zszedłem w BASIC do około godziny na 10 powtórzeń dla SIEVE co jest zgodne z tym co napisali w swoim manualu twórcy Qick 2.0. Na okładce Lightspeed C jest dla BASIC 31 min co bardziej wygląda (co do minuty) na nieskompilowaną wersję SIEVE w TB z użyciem DIM a nie POKE&PEEK.

    CC65           YoshPlus:   41844 iterations in 100 ticks
    Mad Pascal YoshPlus: 35572 iterations in 100 ticks
    Action! YoshPlus: 33239 iterations in 100 ticks
    Quick 2.2 YoshPlus: 21320 iterations in 100 ticks
    Quick 1.6 YoshPlus: 16242 iterations in 100 ticks
    PL65 YoshPlus: 4708 iterations in 100 ticks
    FastBasic FBI YoshPlus: 2427 iterations in 100 ticks
    fig-Forth 1.1 YoshPlus: 715 iterations in 100 ticks
    CLSN Pascal YoshPlus: 487 iterations in 100 ticks

    CC65 Chessboard: 76 iterations in 150 ticks
    Mad Pascal Chessboard: 40 iterations in 150 ticks
    Action! Chessboard: 35 iterations in 150 ticks
    Quick 2.2 Chessboard: 27 iterations in 150 ticks
    Quick 1.6 Chessboard: 16 iterations in 150 ticks
    PL65 Chessboard: 12 iterations in 150 ticks

    MADS (opt) SIEVE: 440 ticks in 10 iterations
    CC65 (opt) SIEVE: 602 ticks in 10 iterations
    Mad Pascal (opt) SIEVE: 644 ticks in 10 iterations
    Mad Pascal SIEVE: 739 ticks in 10 iterations
    Action! SIEVE: 1003 ticks in 10 iterations
    Quick 1.6 SIEVE: 2022 ticks in 10 iterations
    Quick 2.2 SIEVE: 2199 ticks in 10 iterations
    PL65 SIEVE: 3853 ticks in 10 iterations
    FastBasic FBI SIEVE: 6312 ticks in 10 iterations
    fig-Forth 1.1 SIEVE: 8482 ticks in 10 iterations
    Turbo-BASIC XL [C] SIEVE: 16710 ticks in 10 iterations
    Turbo-BASIC XL SIEVE: 64000 ticks in 10 iterations
    BASIC SIEVE: 170700 ticks in 10 iterations
    • 7: CommentAuthorurborg
    • CommentTime24 Feb 2020
     
    @zbyti

    Turbobasicem chętnie bym się pobawił w optymalizację ale dziś nie mam czasu i jutro pewnie też nie dam rady. Zdaje się że w turbo basic możnaby przyśpieszyc kod pozbywając się wszystkich instrukcji goto i zastępując je skokami do procedur.
    • 8: CommentAuthorzbyti
    • CommentTime24 Feb 2020 zmieniony
     
    @urborg to już niech zostanie tak jak jest :]

    Poniżej tabelka do "interpretacji" :D
    • 9: CommentAuthormono
    • CommentTime24 Feb 2020
     

    zbyti:

    ale dlaczego bez X zaburza pracę programu i daje zły wynik w zliczonych liczbach pierwszy?

    Trudno powiedzieć. Podeślij plik to zobaczymy co on robi. Może w SDX jest jakiś bambol.
    • 10: CommentAuthorzbyti
    • CommentTime24 Feb 2020
     
    @mono w złączniku
    • 11: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    Nie testowałem ale według informacji z okładki Lightspeed C to SIEVE w 10 iteracjach i przy wyłączonym ekranie miał:

    Lightspeed C  4:49 min 14450 ticks
    Deep Blue C 9:00 min 27000 ticks
    BASIC 31:00 min 93000 ticks

    Tylko to chyba robi różnicę czy PAL czy NTSC? Nie podano. Ja na ticks przeliczyłem * 50.

    Wyłączony ekran daje (z doświadczenia w Action!) około 25% mocy więcej dla CPU.

    Ciekawe jaki magik napisał to w BASIC tak by jechało tylko 31 min?! Nawet przy wyłączonym ekranie...
    • 12: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    Atalan ->link<-
    RTCLOCK@20:byte

    const SQRT_COUNT = 91

    top:0..8191
    sieve:array(top) of 0..1
    k,j,prime:top
    start,time:byte

    "Computing primes..."

    for k
    sieve(k) = 1

    RTCLOCK = 0

    for i:2..SQRT_COUNT where sieve(i) = 1
    j = i * 2
    while j<=8191
    sieve(j) = 0
    j = j + i

    time = RTCLOCK

    "Time used: [time] ticks"
    "Press Q to quit, any other key for list"

    CH = none
    until CH <> none

    for k where sieve(k) = 1 until CH = Q
    "[k]"

    CH = none

    ; Sieve of Erastosthenes
    ; Demo program for ATALAN programming language
    ;(c) 2010 Rudla Kudla
    ;
    ;This version uses bit array so it can find primes up to $ffff.

    use atari
    out rtclock1@20:byte
    out rtclock2@19:byte

    ;Maximum possible prime number.

    const max_prime = $ffff

    const bmax = max_prime/8
    count:0..max_prime

    const
    mask:array(0..7) = 1,2,4,8,16,32,64,128
    maskx:array(0..7) = %1111'1110,%1111'1101,%1111'1011,%1111'0111,%1110'1111,%1101'1111,%1011'1111,%0111'1111

    flags:array(bmax)

    rtclock1 = 0
    rtclock2 = 0

    for i:0..bmax flags(i)=$aa

    for i:3..sqrt max_prime step 2 where (flags(i/8) bitand mask(i mod 8) <> 0)
    for k:i*i..max_prime step 2*i
    flags(k/8) = flags(k/8) bitand maskx(k mod 8)

    count = 1
    for k:3..max_prime step 2 where (flags(k/8) bitand mask(k mod 8) <> 0)
    inc count

    t = rtclock2 * 256 + rtclock1

    "[count] prime numbers in [t] ticks"

    No to mamy nowego pretendenta ;) Chyba algorytm jest tutaj sprytniejszy, po nocy nie będę analizował ;)

    EDIT:
    Jak opanuję podstawy języka to przepiszę na "nasz" i wrzucę do zestawienia :]
    • 13: CommentAuthorilmenit
    • CommentTime25 Feb 2020
     
    Trzeba by przepisać na ten sam algo...
    • 14: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    @ilmenit mówisz o Atalan? Dopiero się o nim dowiedziałem, jak go ogarnę to przepiszę ;) Powyższy kod jest z dolączonych przykładów.

    Ogarniałem te z listy na stronie ->link<- a tam nie widnieje w spisie, albo coś przeoczyłem.

    No to wyedytuję post i słowo "mistrz" zamienię na "pretendent" ;)
    • 15: CommentAuthorilmenit
    • CommentTime25 Feb 2020
     
    Haha :D Zbyti, dla mnie to jeden z najciekawszych wątków od dawna!
    • 16: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    @ilmenit cieszę się bo myślałem, że nudzę starych wyjadaczy swoją amatorszczyzną ;) Dla mnie to sposób by się "oswoić" z Atari :]
    • 17: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    Wersja SIEVE dla TBA z przerzuceniem wartości do zmiennych jest wolniejsza od tej z liczbami zabitymi na sztywno w interpretatorze o 16 ticks ale skompilowana już szybsza o 38 ticks dla jednego przebiegu.
    • 18: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    To jeszcze paczuszka, z większością źródeł używanych w testach jaką wrzuciłem na atariage.

    Użyte zostały oficjalne, najnowsze wydania języków na dzień 20.02.2020.
    • 19: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    O dziwo wynik, na C64 w jednym przebiegu jest praktycznie ten sam co na A8 (zakładam, że wrzucenie zmiennych na początek zrobiło podobny narzut interpreterowi jak na A8).
    • 20: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    Niezła dopałka BASIC V2 na C64 to MOSpeed.

    Do obadania ->link<- i tutaj ->link<- puszczone skryptem mospeed.sh z paczki bez żadnych dodatkowych flag.

    10 rem * c64 sieve
    11 a=4096*2:c=8190:b=a+c
    12 poke 161,0:poke 162,0:count=0
    13 for i=a to b:poke i,1:next i
    14 for i=a to b
    15 if peek(i)=0 then 20
    16 ia=i-a:prime=ia+ia+3:k=ia+prime
    17 if k>c then 19
    18 poke k+a,0:k=k+prime:goto 17
    19 count=count+1
    20 next i
    21 print peek(162)+256*peek(161);" jiffies"
    22 print count;" primes"


    • 21: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    Jak widzę @jhusak napisał w Atlanie grę 10 lat temu. Normalnie Leonardo, tak jak o nim mówią ;)

    Atlan dla linuxsiarzy ->link<-

    Niestety nie działa "z pudełka" :(

    Building esieve.atl...

    atari.atl(320) Syntax error: Expected instruction or string

    rule proc %A:rasterProc =
    ^

    Coś jest dokumentnie zdygane w tej wersji z GitHuba. Nie pobawię się widzę... Gość co wystawił te repo, nawrzucał zmiana dla C64 ale dla Atari coś spier...
    • 22: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    Rzuciłem okiem na art. ->link<- i odnalazł się kolejny szybki BASIC, ADVAN zakończył test z wynikiem na poziomie zbliżonym do FastBasic.

    A ponoć jeszcze jest ADVAN OPTIMIZER który ma być 120x szybszy od zwykłego BASIC'a. Plasował by się wtedy zaraz za Action w naszej tabelce.

    Advan BASIC was already pretty fast. Now it's the fastest BASIC in Atari history. In our Sieve Benchmark, the Advan Optimizing Compiler is about four times faster than the MMG Compiler, six times faster than regular Advan, 20 times faster than compiled Turbo-BASIC XL and 120 times faster than uncompiled Atari BASIC. In fact, it's more than half the speed of ACTION!- that's getting real close to pure assembly language.


    Na screenach wersja regular. Algorytm chyba lekko sprawniejszy, ale nie mam siły już tego przepisywać na inne BASIC-i ;)
    • 23:
       
      CommentAuthorjhusak
    • CommentTime25 Feb 2020
     
    O co chodzi z tym Leonardem?

    Z atalanem - jest problem, bo całe repo było na svn, czyli cała historia poszła w ....
    Nie wiem, czy jest to do odzyskania.

    Natomiast po swojej stronie mam kilka "snapshotów", coś ponad 10 z różnych stadiów.

    Problem zaczął się, gdy Rudli wybuchł przyjęty model (wzorce generowanego kodu w zależności od typów parametrów) przy wprowadzaniu 3-bajtowych liczb.

    Rozmawiałem z Rudlą nt. przyjętego rozwiązania (nie używał narzędzi typu bison, byacc), napisał, że "chce mieć wszystko pod kontrolą" - jak widać kontrola mu się i tak rozjechała tak, że się znudził (czy jakoś tak) projektem.
    • 24: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    @jhusak no za Leonarda mają Cie Kaz & TDC ;) Ale nie tego z TBBT :D

    Dzięki za obszerniejsze info o Atalanie, strasznie się napaliłem ale nijak nie mogę tego uruchomić na A8 jako target :(

    -------------

    A teraz ADVAN OPTIMIZER w akcji! Gdyby zrobić 10 iteracji to wynik po przeliczeniu odpowiada temu z Action! i wynosi 1050 ticks!

    CC65           YoshPlus:   41844 iterations in 100 ticks
    Mad Pascal YoshPlus: 35572 iterations in 100 ticks
    Action! YoshPlus: 33239 iterations in 100 ticks
    Quick 2.2 YoshPlus: 21320 iterations in 100 ticks
    Quick 1.6 YoshPlus: 16242 iterations in 100 ticks
    PL65 YoshPlus: 4708 iterations in 100 ticks
    FastBasic FBI YoshPlus: 2427 iterations in 100 ticks
    fig-Forth 1.1 YoshPlus: 715 iterations in 100 ticks
    CLSN Pascal YoshPlus: 487 iterations in 100 ticks

    CC65 Chessboard: 76 iterations in 150 ticks
    Mad Pascal Chessboard: 40 iterations in 150 ticks
    Action! Chessboard: 35 iterations in 150 ticks
    Quick 2.2 Chessboard: 27 iterations in 150 ticks
    Quick 1.6 Chessboard: 16 iterations in 150 ticks
    PL65 Chessboard: 12 iterations in 150 ticks

    MADS (opt) SIEVE: 440 ticks in 10 iterations
    CC65 (opt) SIEVE: 602 ticks in 10 iterations
    Mad Pascal (opt) SIEVE: 644 ticks in 10 iterations
    Mad Pascal SIEVE: 739 ticks in 10 iterations
    Action! SIEVE: 1003 ticks in 10 iterations
    Advan BASIC (opt) SIEVE: 1050 ticks in 10 iterations
    Quick 1.6 SIEVE: 2022 ticks in 10 iterations
    Quick 2.2 SIEVE: 2199 ticks in 10 iterations
    PL65 SIEVE: 3853 ticks in 10 iterations
    FastBasic FBI SIEVE: 6312 ticks in 10 iterations
    Advan BASIC SIEVE: 6800 ticks in 10 iterations
    fig-Forth 1.1 SIEVE: 8482 ticks in 10 iterations
    Turbo-BASIC XL [C] SIEVE: 16710 ticks in 10 iterations
    Turbo-BASIC XL SIEVE: 64000 ticks in 10 iterations
    BASIC SIEVE: 170700 ticks in 10 iterations
    • 25:
       
      CommentAuthorjhusak
    • CommentTime25 Feb 2020 zmieniony
     
    A z tym esieve.atl skompilowałem starutką wersją v29 i wyszło 38 ticks na 1 obrót, co daje ~380 ticks na 10. I tak jest świetnie.
    Z tego wynika, że najprawdopodobniej podejście Rudli jest najlepsze do generowania kodu na 6502.
    Jest taka strona ->link<- pokazująca i opisująca różne rozwiązania kompilatorów wyżej czy niżejpoziomowych.
    • 26: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    @jhusak ale tam jest inny algorytm, jakbyś go przerobił na ten używany przez nas to było by to lepsze do porównania.

    Jest wyżej paczka z kodami to możesz sobaczyć sieve w kilu językach, jeżeli miałbyś czas i chęć przenieść na Atalane.

    Wiem, że tyle wychodzi bo sobie asm skompilowałem ;) Chciałem przerobić ale nie mam jak :[
    • 27:
       
      CommentAuthorjhusak
    • CommentTime25 Feb 2020
     
    Spróbuję w wolnej chwili przerobić, tylko muszę sobie przypomnieć :)
    • 28: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    No i algorytm panów od Advan Basic jest bardzo szybką opcją :] Turbo BASIC XL nieskompilowany przyspieszył o ~30% :] Za to skompilowana zwolniła :D

    Nie odmówię sobie jednak i w wolnej chwili po przepisuję ten benchmark :] Ale tabelki już nie podbijam.

    Teraz widzę, że FastBasic używa tego samego algorytmu co Advan Basic więc i tak tabelka do przepisania ;)
    • 29: CommentAuthorilmenit
    • CommentTime25 Feb 2020
     
    Problem zaczął się, gdy Rudli wybuchł przyjęty model (wzorce generowanego kodu w zależności od typów parametrów) przy wprowadzaniu 3-bajtowych liczb.

    Możesz napisać coś więcej? Podejście w Atalanie do generacji kodu było całkiem ciekawe (choć nie nowe, artykuł o podobnym sposobie z 1968 roku ->link<- ;) ).
    Kiedyś nawet myślałem, żeby do tego projektu dołączyć i zrobić superoptimizer dla 6502 na styl ->link<- . Teraz widzę, że nie byłem jedyny i już są projekty takie dla 6502 np. ->link<-
    • 30: CommentAuthorzbyti
    • CommentTime25 Feb 2020 zmieniony
     
    Podbijam prośbę @ilmenit :]

    --------------------------------------------------

    Atari Basic na nowym algo :]
    • 31: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    Sprawa okazuje się odwrotna, tylko dla Atari Basic, Turbo Basic XL (nawet usprawniając kod przepisany z ANALOGU) miałem inną implementację niż reszta paczki.

    Action! Pascal i inne mają taką jak Advan Basic czy FastBasic także co było do poprawienia to już poprawiłem, więc uzupełnię tabelkę od razu :]
    • 32: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    CC65           YoshPlus:   41844 iterations in 100 ticks
    Mad Pascal YoshPlus: 35572 iterations in 100 ticks
    Action! YoshPlus: 33239 iterations in 100 ticks
    Quick 2.2 YoshPlus: 21320 iterations in 100 ticks
    Quick 1.6 YoshPlus: 16242 iterations in 100 ticks
    PL65 YoshPlus: 4708 iterations in 100 ticks
    FastBasic FBI YoshPlus: 2427 iterations in 100 ticks
    fig-Forth 1.1 YoshPlus: 715 iterations in 100 ticks
    CLSN Pascal YoshPlus: 487 iterations in 100 ticks

    CC65 Chessboard: 76 iterations in 150 ticks
    Mad Pascal Chessboard: 40 iterations in 150 ticks
    Action! Chessboard: 35 iterations in 150 ticks
    Quick 2.2 Chessboard: 27 iterations in 150 ticks
    Quick 1.6 Chessboard: 16 iterations in 150 ticks
    PL65 Chessboard: 12 iterations in 150 ticks

    MADS (opt) SIEVE: 440 ticks in 10 iterations
    CC65 (opt) SIEVE: 602 ticks in 10 iterations
    Mad Pascal (opt) SIEVE: 644 ticks in 10 iterations
    Mad Pascal SIEVE: 739 ticks in 10 iterations
    Action! SIEVE: 1003 ticks in 10 iterations
    Advan BASIC (opt) SIEVE: 1050 ticks in 10 iterations
    Quick 1.6 SIEVE: 2022 ticks in 10 iterations
    Quick 2.2 SIEVE: 2199 ticks in 10 iterations
    PL65 SIEVE: 3853 ticks in 10 iterations
    FastBasic FBI SIEVE: 6312 ticks in 10 iterations
    Advan BASIC SIEVE: 6800 ticks in 10 iterations
    fig-Forth 1.1 SIEVE: 8482 ticks in 10 iterations
    Turbo-BASIC XL [C] SIEVE: 16880 ticks in 10 iterations
    Turbo-BASIC XL SIEVE: 46060 ticks in 10 iterations
    BASIC SIEVE: 133960 ticks in 10 iterations
    • 33: CommentAuthorilmenit
    • CommentTime26 Feb 2020 zmieniony
     
    @zbyti - może warto by zmienić "MADS" na "Asm (MADS) (opt)"?
    • 34: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    @ilmenit zrobię tak jeżeli dostanę wyniki z innego assamblera. Na ten moment nie mam go od czego odróżniać :]

    Znalazłem właśnie fajną stronkę ->link<- szkoda, że nie zaszukałem wcześniej :]

    -----------------------------------------------------------

    Tymczasem, by sobie jednak porównać z Atalanem wklepię to:

    DIM n AS Integer, k AS Integer, limit AS Integer

    INPUT "Enter number to search to: "; limit
    DIM flags(limit) AS Integer

    FOR n = 2 TO SQR(limit)
    IF flags(n) = 0 THEN
    FOR k = n*n TO limit STEP n
    flags(k) = 1
    NEXT k
    END IF
    NEXT n

    ' Display the primes
    FOR n = 2 TO limit
    IF flags(n) = 0 THEN PRINT n; ", ";
    NEXT n
    • 35: CommentAuthorilmenit
    • CommentTime26 Feb 2020 zmieniony
     
    @zbyti - wyniki zależnie od asemblera różnić się nie będą. To w końcu kod maszynowy.

    A oto i Millfork 0.3.14, który wychodzi na prowadzenie ;)

    Chessboard nie zmienia tryby graficznego, bo nie widziałem jak to prosto w tym języku napisać (wsparcie dla Atari OS jest tam aktualnie minimalne), ale nie powinno to wpływać znacząco na wynik.

    Zaskakująco słabo wypadł test Sieve. Napiszę do autora języka, czy można jakoś zoptymalizować ten kod pozostawiając algorytm.

    Rezultaty:
    Yoshplus - 41921
    Chessboard - 79
    Sieve (opt) - 701
    Sieve (non-opt) - 791
    • 36: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    @ilmenit jutro to wrzucę w tabelę. Wyniki naprawdę zachęcające!

    Każdy assembler ta taki sam kod maszynowy? Chyba to czasem się różni, makra te sprawy, ale faktycznie jakby nie używać ficzerów to wszędzie powinno być tak samo.

    Zaimplementowałem ten kod z esieve.atl.

    Przy tym samym algorytmie Mad Pascal z optymalizacją w jednym przebiegu jest 3 ticks wolniejszy od Atalana.

    Zaimplementowałem dla pewności jeszcze w Advan Basic (bez optymalizacji i z optymalizacją). Mad Pascal jest z opt.

    Ergo. Jeżeli Atalan chce się znaleźć w naszej tabelce ktoś musi napisać SIEVE po naszemu. Albo my korygujemy.

    // Eratosthenes Sieve Benchmark

    uses crt;

    {$define FAST}

    const
    size = 8191;
    sqr_count = 91;

    var
    flags: array [0..size] of boolean;
    rtClock: byte absolute $14;

    {$ifdef FAST}
    n: word absolute $e0;
    k: word absolute $e2;
    count: word absolute $e6;
    {$else}
    n, k, count: word;
    {$endif}

    begin
    writeln('Mad Pascal');
    writeln('Eratosthenes Sieve Benchmark');

    rtClock := 0;
    fillchar(flags, sizeof(flags), true);
    for n := 2 to sqr_count do begin
    if flags[n] then begin
    k := n shl 1;
    while k <= size do begin
    flags[k] := false;
    Inc(k,n);
    end;
    end;
    end;
    writeln(rtClock, ' ticks');

    count :=0;
    for n := 2 to size do begin
    if flags[n] then Inc(count);
    end;

    writeln(count, ' primes');
    repeat until keypressed;
    end.
    • 37: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    Tak dla porządku:

    There are 1229 prime numbers between 1 and 10,000. They are given here below ->link<-



    Czyli powinniśmy znaleźć 1028 liczb pierwszych jeżeli ostatnią ma być 8191 :]

    To znaczy, że SIEVE z naszych testów źle liczy a ten z Atalan dobrze.

    Zastanawia mnie powszechność tej złej implementacji co oddaje 1899 liczb?
    • 38: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    Millfork              YoshPlus:41921 iterations in 100 ticks
    CC65 YoshPlus:41844 iterations in 100 ticks
    Mad Pascal YoshPlus:35572 iterations in 100 ticks
    Action! YoshPlus:33239 iterations in 100 ticks
    Quick 2.2 YoshPlus:21320 iterations in 100 ticks
    Quick 1.6 YoshPlus:16242 iterations in 100 ticks
    PL65 YoshPlus: 4708 iterations in 100 ticks
    FastBasic FBI YoshPlus: 2427 iterations in 100 ticks
    fig-Forth 1.1 YoshPlus: 715 iterations in 100 ticks
    CLSN Pascal YoshPlus: 487 iterations in 100 ticks

    Millfork Chessboard: 79 iterations in 150 ticks
    CC65 Chessboard: 76 iterations in 150 ticks
    Mad Pascal Chessboard: 40 iterations in 150 ticks
    Action! Chessboard: 35 iterations in 150 ticks
    Quick 2.2 Chessboard: 27 iterations in 150 ticks
    Quick 1.6 Chessboard: 16 iterations in 150 ticks
    PL65 Chessboard: 12 iterations in 150 ticks

    MADS 2.1.0 (opt) SIEVE: 440 ticks in 10 iterations
    CC65 2.1.8 (opt) SIEVE: 602 ticks in 10 iterations
    Mad Pascal 1.6.4 (opt) SIEVE: 644 ticks in 10 iterations
    Millfork 0.3.14 (opt) SIEVE: 701 ticks in 10 iterations
    Mad Pascal 1.6.4 SIEVE: 739 ticks in 10 iterations
    Millfork 0.3.14 SIEVE: 791 ticks in 10 iterations
    Action! 3.7p SIEVE: 1003 ticks in 10 iterations
    Advan BASIC (opt) SIEVE: 1050 ticks in 10 iterations
    Quick 1.6 SIEVE: 2022 ticks in 10 iterations
    Quick 2.2 SIEVE: 2199 ticks in 10 iterations
    PL65 SIEVE: 3853 ticks in 10 iterations
    FastBasic 4.0 FBI SIEVE: 6312 ticks in 10 iterations
    Advan BASIC SIEVE: 6800 ticks in 10 iterations
    fig-Forth 1.1 SIEVE: 8482 ticks in 10 iterations
    Turbo-BASIC XL 1.5 [C] SIEVE: 16880 ticks in 10 iterations
    Turbo-BASIC XL 1.5 SIEVE: 46060 ticks in 10 iterations
    Atari BASIC SIEVE: 133960 ticks in 10 iterations
    • 39: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    Ten algorytm na liczby pierwsze który używamy w teście jest zdecydowanie do dupy. Zbiera 956 liczb parzystych ;P czyli nie wyłapuje w tych 1899 wszystkich pierwszych a za to ma połowę parzystych :D

    To się powinno nazwyać Benchmark po prostu, bo sitem Eratosthenes na pewno nie jest.

    W wolnej chwili przepiszę w tych językach co się bawiłem na poprawny algorytm.

    Zadziwia, że w prasie i dołączonych demkach do niektórych języków programowania właśnie ten poniżej był wrzucany...

    // Fake Eratosthenes Sieve Benchmark

    uses crt, sysutils;

    {$define FAST}

    const
    size = 8191;
    iter_max = 1;

    var
    flags: array [0..size] of boolean;

    iter: byte;
    starttime: cardinal;

    {$ifdef FAST}
    i: word absolute $e0;
    k: word absolute $e2;
    prime: word absolute $e4;
    count: word absolute $e6;
    {$else}
    i, k, prime, count: word;
    {$endif}

    begin

    writeln(iter_max,' iterations');

    starttime := GetTickCount;
    fillchar(flags, sizeof(flags), true);

    i:=0; count := 0;

    while i <= size do begin

    if flags[i] then begin

    prime := i shl 1 + 3;
    k := prime + i;

    while (k <= size) do begin
    flags[k] := false;
    inc(k, prime);
    end;
    inc(count);
    end;

    inc(i);
    end;

    writeln(count, ' primes');
    writeln(GetTickCount - starttime, ' ticks');

    count := 0;
    for i := 3 to size do begin
    if flags[i] then begin
    if (i mod 2) = 0 then begin write(i,' '); inc(count) end;
    end;
    end;
    writeln('');
    writeln(count, ' even numbers count');

    repeat until keypressed;

    end.

    Tak z pamięci do których języków miałem SIEVE gotowe i to był ten Fake:

    1. FastBasic (dyskietka)
    2. Advan Basic (dyskietka)
    3. Action! (z atariwiki)
    4. PL65 (z manuala)
    5. FORTH (z atariwiki)
    6. MADS (ze źródłami)
    7. Mad Pascal (ze źródłami)
    8. Lightspeed C (dyskietka)

    Także dość powszechny jest ten zły algorytm :]
    • 40: CommentAuthortebe
    • CommentTime26 Feb 2020
     
    liczy się algorytm, skoro był ten sam to liczył to samo

    jedynie nie zgadza się nazwa algorytmu :)
    • 41: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    @tebe ale to mamy takie kuriozum jak na okładce manuala do Lightspeed C :D

    Załączony przez nich na dyskietce benchmark SIEVE to ten nasz fejk, ale porównują go do wyniku BASIC'a który u nich wyrabia się w 31 min co oznacza, że ten algo do BASIC'a musieli już mieć poprawny. Przez co wyszło, że ich język nie jest aż tak szybki w porównaniu do BASIC'a jak w istocie jest ;)

    Ale nie kompilowałem nic pod Lithspeed C więc czy swój wynik podali poprawnie to też nie wiem. Ale na oko wygląda, że tak. Skoro sami napisali, ze są około 10x wolniejsi od Action!.

    Wygląda na to, że ktoś celowo lub nie skopał w zamierzchłych czasach tego SIEVE a wiele osób skopiowało tą niepoprawną implementację nie wnikając w uzyskany wynik :]

    Taka moja teoria.

    No chyba, że na jakiejś konfie w 1978 uznano skopanego SIEVE za standard do testowania wydajności z pełną świadomością jego wady :]
    • 42: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    No to wprowadzam podział na FAKE i REAL
    • 43: CommentAuthortebe
    • CommentTime26 Feb 2020
     
    odkryłeś trupa w szafie ;)
    • 44: CommentAuthormav
    • CommentTime26 Feb 2020
     
    Podoba i jednocześnie niepokoi mnie stan zaangażowanego zbytiego ;)
    • 45: CommentAuthorzbyti
    • CommentTime26 Feb 2020
     
    @mav to jest nas dwóch :D
    • 46: CommentAuthortebe
    • CommentTime26 Feb 2020
     
    nie ma oficjalnie wydanej wersji MP 1.6.4, jest tylko 1.6.3

    wersja 1.6.4 nie uzyskuje wyniku 644 dla Fake Sieve
    • 47: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    @tebe u mnie na atari800 Ubuntu osiąga 644 i jest to wynik powtarzalny po wystartowaniu emulatora.

    Mad Pascal Compiler version 1.6.4 [2020/02/02] for 6502

    Od dłuższego czasu mam tę wersję, nie wiedziałem, że jeszcze nie jest publiczna.

    Jak dodam pause to 649. Ale praktycznie nigdzie tego nie robię. Tylko w MadP Chessboard wołam pause jeszcze. Oszacowanie mnie interesuje, przy 10 iteracjach te 5 ramek nie zmienia wyniku w tabeli.

    Proszę podaj poprawne wyniki dla właściwej wersji to zmienię.
    • 48: CommentAuthortebe
    • CommentTime26 Feb 2020
     
    przedtem w tabelce był po prostu 'Mad Pascal', teraz pojawiła się wersja, bezpieczniej bez wersji
    • 49: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    @tebe to już sam nie wiem, @ilmenit chyba chciałby z wersją.

    Ja chętnie wersję usunę bo mniej pisania ;)

    Podanie wersji pozwoli śledzić progress lub regres kompilatora.

    ----------------------------------------------

    Action! Real Sieve, jedna iteracja.

    BYTE ch=764      ; ESC = 28
    BYTE RTCLOCK2=20 ; sys timer
    BYTE RTCLOCK1=19
    BYTE ARRAY FLAGS(8191)

    PROC sieve()
    BYTE SQRCOUNT=[91]
    CARD N,K

    FOR N=0 TO 8191
    DO
    FLAGS(N)='T
    OD

    FOR N=2 TO SQRCOUNT
    DO
    IF FLAGS(N)='T THEN
    K=N*2
    WHILE K<=8191
    DO
    FLAGS(K)='F
    K==+N
    OD
    FI
    OD
    RETURN

    PROC main()
    CARD STOP,N
    CARD COUNT=[0]

    RTCLOCK1=0
    RTCLOCK2=0
    sieve()
    STOP=RTCLOCK1 * 256 + RTCLOCK2
    PRINTF("%E %U JIFFIES",STOP)

    FOR N=2 TO 8191
    DO
    IF FLAGS(N)='T THEN COUNT==+1 FI
    OD
    PRINTF("%E %U PRIMES",COUNT)

    WHILE ch=255 DO OD
    RETURN
    • 50: CommentAuthorzbyti
    • CommentTime26 Feb 2020 zmieniony
     
    Na AtariAge twórca FastBasic'a skomentował moje/nasze testy ->link<- :]

    Czyżby też się nie orientował, że SIEVE jakie dołącza do programu jest wadliwe?