atarionline.pl zupełnie głupi konkurs - Forum Atarum

    Jeśli chcesz wziąć udział w dyskusjach na forum - zaloguj się. Jeżeli nie masz loginu - poproś o członkostwo.

    • :
    • :

    Vanilla 1.1.4 jest produktem Lussumo. Więcej informacji: Dokumentacja, Forum.

      • 1: CommentAuthormarok
      • CommentTime5 Oct 2024 08:10
       
      object: "wa*l to, kolego"

      Czy łatwo przyjść z odpowiedzią na pytanie, jak należy czytać pierwszy wyraz w pow. sformułowaniu?

      Rzeczona "*" w (nie mam wątpliwości) wyrazie ("w…l") zastąpiła inny znak semigraficzny (uważam że bez znaczenia jaki), a wyraz jest polski (wynika z kontekstu "sformułowania").

      Niniejszym zadaję konkretne pytanie konkursowe (po tym wstępnym): ten wyraz, tak w pierwszym zetknięciu (na tym polega ten głupi 'konkurs'), to jaka to część mowy? (Przypominam, że chodzi tu, w odpowiedzi bezsprzecznie o takie terminy jak: czasownik, rzeczownik, przymiotnik, przysłówek, itd.; a dla ułatwienia - pasuje tu (na moje rozeznanie przynajmniej) jedna, góra dwie odpowiedzi z wymienionych ;) ).
      • 2:
         
        CommentAuthorKaz
      • CommentTime5 Oct 2024 09:10
       
      Mam nadzieję, że ten post prowadzi do jakiegoś sensownego tematu :)

      Zracam tylko uwagę, że napisałeś najpierw słowo "wa*l", a potem "w…l" bez litery "a". O który wariant pytasz?
      • 3: CommentAuthormarok
      • CommentTime5 Oct 2024 09:10
       
      O ten z literą "a".

      Co do sensu - będzie on myślę jakiś.
      • 4: CommentAuthorAdam
      • CommentTime5 Oct 2024 12:10
       
      Ja bym przeczytał to jako "wal to". Niektórzy wstawiają dodatkowe znaki wewnątrz wyrazów, które de facto żadnych liter nie zastępują, żeby np. dana wypowiedź nie została zakwalifikowana jako zawierająca wulgaryzmy.
      • 5: CommentAuthormono
      • CommentTime5 Oct 2024 13:10
       
      semigraficzny?
      • 6: CommentAuthormarok
      • CommentTime5 Oct 2024 13:10
       
      @Adam: Dziękuję za odpowiedź (na głupie pytanie, więc tym bardziej).

      W zasadzie więc kwalifikuję Twoją odpowiedź że chodziło w tym zapisie o wyraz będący czasownikiem.

      (Konkretnie że "wal".)

      Na ten moment nic więcej nie piszę, bo może zbiorę więcej głosów tej sondy czy, jak to ująłem, pytania konkursowego.
      • 7: CommentAuthormarok
      • CommentTime5 Oct 2024 13:10
       
      @mono: a tak (chyba że to źle nazywam), bo miałem na myśli "serduszko" atarowskie (na znakach - czyli kod 0x00), które zastąpione jest tu "*", bo było łatwiej przedstawić.
      • 8: CommentAuthorgorgh
      • CommentTime5 Oct 2024 19:10
       
      • 9:
         
        CommentAuthorpirx
      • CommentTime5 Oct 2024 19:10
       
      wszystkie polskie słowa, które spełniają kryteria "wa*l" to
      wafel
      wajgel
      wakuol
      wal
      wandal
      wangal
      warchol
      wasal

      a więc, dwója bęc, ktoś mógłby prezentować wafel słowami
      "wafel to, kolego"

      czyli rzeczownik
      • 10: CommentAuthorAdam
      • CommentTime5 Oct 2024 20:10 zmieniony
       

      pirx:

      wszystkie polskie słowa, które spełniają kryteria "wa*l" to

      No nie do końca, gdzie np. "Wawel" i "Wasyl"? :) Poza tym zakładam, że "l" może oznaczać tutaj również "ł", więc pasuje więcej słów (choćby "warknął").

      Ale oczywiście o przymiotniku czy przysłówku nie może być mowy.
      • 11: CommentAuthormarok
      • CommentTime5 Oct 2024 20:10
       
      @pirx: Szacunek z mojej strony i podziękowanie.

      Jak oceniam, przygotowanie takiej odpowiedzi wymagało już odrobiny pracy i chwilki logicznego wnioskowania, na którym można oprzeć jakoś sensownie swoją odpowiedź.

      Muszę przyznać że ten cel został tu osiągnięty, odpowiedź się logicznie broni, a nawet mógłbym się pod tym rozwiązaniem podpisać (byłoby może to dla mnie samego korzystniejsze nawet, biorąc pod uwagę użycie słowa "konkurs").

      Jednak zmuszony jestem napisać, że nie taki zamysł miał autor (przysłowiowy artysta).

      Może chodzi o rzeczownik, ale niekoniecznie z listy. Logika jest dużo prostsza, wymagająca pewnej tylko wizualizacji może, podstawienia liter/-y (kojarzy mi się z tym słowo "kalambur")?

      Ale Ty się tym już nie zajmuj, proponuję (szkoda Twojego czasu). Zapewniam, że rozwiązanie jest zbyt banalne na zbyt skomplikowane łamanie sobie tym głowy (skoro podeszło się już kreatywnie do problemu z innej, ciekawej stony - wystarczy). Na koniec może być z tego duże rozczarowanie.

      @gorgh: zupełnie nie chwyciłem sensu czy intencji w Twojej

      @Adam: powiadasz - "ł"? :)
      • 12: CommentAuthormarok
      • CommentTime5 Oct 2024 20:10
       
      @gorgh: przepraszam - już dostrzegam powiązanie
      (przestraszyłem się trochę i małp i drastycznego dla mnie tytułu)
      • 13: CommentAuthorAdam
      • CommentTime6 Oct 2024 00:10
       

      marok:

      (...) Jednak zmuszony jestem napisać, że nie taki zamysł miał autor (przysłowiowy artysta). (...)

      @Adam: powiadasz - "ł"? :)

      Czy mam rozumieć z uśmiechu, że to właśnie jest "ł"?

      Nie wiem, co autor wypowiedzi "wa<serduszko>ł to, kolego" faktycznie miałby mieć na myśli, ale mam dwa pomysły:

      1. najbardziej naturalnie brzmi tu jednak czasownik, a jeśli jeszcze dodamy wszelkie możliwe skojarzenia związane z serduszkiem (chociaż twierdzisz, że rodzaj użytego znaku jest nieistotny), to najbardziej pasuje mi fraza "ważył to, kolego".

      2. jednocześnie jednak piszesz, że "może chodzi o rzeczownik". Idąc takim tokiem rozumowania, że najczęściej ukrywa się w podobny sposób treści wulgarne, obraźliwe lub kojarzące się erotycznie oraz konkurs jest, jak piszesz, "zupełnie głupi", właśnie wymyśliłem słowo "waginał" (i ktoś już tego słowa użył wcześniej w "internetach") ;)
      • 14: CommentAuthoras...
      • CommentTime6 Oct 2024 00:10
       
      Władca!
      • 15: CommentAuthormarok
      • CommentTime6 Oct 2024 09:10
       
      @Adam: Widzę, że zająłem Ci uwagę i czas. Mam nadzieję, że się nie rozczarujesz odpowiedzią.
      (Szanuję to i dziękuję.)

      @As: Pewnie to podpowiedź o "kalamburze" doprowadziła Cię do jednego ze swoich ulubionych tytułów gier na Atari? :)


      Dobrze, to może to zamknę na tym etapie.

      Odpowiedź formalna to rzeczownik.

      Słowo ('domyślne') to: "wał" - ot, tylko.

      Sporo zamieszania sprawiło podanie form szukanego słowa z gwiazdką i wielokropkiem - uprawdopodobniło tezę że jest tego tam (powiedzmy że "ciemnej materii" czyli brakujących literek) coś, a nie było wcale.
      Także trochę zbyt dużego znaczenia nabrała dobrana do słowa pasująca jakoś sentencja.


      Dobrze, nie było to zbyt mądre.


      Ogólnie, wszystko bierze się z tego, że zastanawiałem się nad różnymi formami dwuczłonowego (znakowego) oddania zapisu polskich (i nie tylko) znaków z formatu UTF na Atari.

      Moja ogólna myśl jest jeszcze taka, że mając tekst ASCII z polskimi literkami podstawionymi pod kody semigraficzne (np. w form. Panther) a nie mając do nich przygotowanych fontów to, jest to zapis wciąż czytelny. Czyta się to bezproblemowo, w moim odczuciu. Jest to kwestia krótkiego przystosowania i przestawienia "na wejściu", i potem idzie to już bezproblemowo.

      Zastanowiło mnie, czy zapis w takiej dwuczłonowej formie, byłby porównywalnie dobry, równie znośny.
      W końcu nie jesteśmy nawyknięci do odczytywania dwu znaków jako jednego. Nawet wspomaganie kojarzenia w postaci drugiego znaku, który miałby podpowiadać jak czytać ten pierwszy, może nie rekompensować deficytów tego rozwiązania.

      Do tych deficytów należy pewnie dodać potencjalne problemy innego formatowania tekstu niż przystosowanie do konkretnej szerokości ekranu (jak na Atari 40 kolumn czy podobnie), chociaż pamiętać należy że to mają być konwersje tekstów UTF, więc tekst 'czytany na dziko' (bez specjalnego podejścia / przygotowania) z założenia będzie się 'łamał' w słowach (te na dwie części) i raczej tak czy inaczej będzie mniej przyjemny w odbiorze.

      Ogólnie zarysowane korzyści takiego przedstawiania znaków 'spec językowych' są takie, że możemy konwertować teksty do jednego formatu z wielu języków równocześnie. Możemy dostosować stosunkowo prosto czytnik do obsługi takich tekstów.


      Dlaczego mielibyśmy konwertować teksty z UTF?
      Wydaje mi się to 'przyszłościowe'.

      Dlaczego do jakiegoś jednego wybranego formatu?
      Niekoniecznie do jednego. W zasadzie to nie konwertować, ale bardziej: pakować jako takie i dopiero w momencie rozpakowywania takiego tekstu z powrotem dostosowywać formę prezentacji (więc konwertować na etapie rozpakowywania) poszczególnych znaków językowych do potrzeb i możliwości 'ekspresji wizualnej' (chodzi o oprogramowanie, dostępność fontów, etc.).

      Taki paker musiałby być wydajny raczej, żeby się nim był większy sens posługiwać?
      Nie wykluczam. To kwestia szczegółowa formatu takiego archiwum. Rzecz o tyle ważna, co ambicjonalna. Zawsze można coś przy tym zmienić i poprawić. Taki paker z założenia nawet, mógłby mieć formę możliwie otwartą - przystosowaną do wprowadzenia różnych i/lub dodatkowych rozwiązań przez wielu autorów.

      Czyli byłby to równocześnie zestaw depakera i konwertera w jednym, na jakiej zasadzie miałoby to jednak działać?
      Na zasadzie tablicy z wpisanymi znakami do konwersji (i po) załączonymi do kodu depakera(+konwertera).
      Miejsca, jak szacuję, jest na około 80 znaków językowych ponieważ miło by było (oprogramowanie) mieścić się z taką tablicą na jednej stronie pamięci.
      To jest jedna z niewielu rzeczy, którą mogę na tym etapie już mieć skonkretyzowaną w postaci (zupełnie nieprzetestowanej - więc bardzo niepewnej) skonstruowanego kodu - wyszło mi (pewnie aż) $62 bajty samego tego konwertera. Konwerter musi oprócz obsługi znaków językowych obsługiwać również konwersję znaków sterujących - tych podstawowych (np. znak końca linii 0x0A, ogólnie tych: 0x00-0x1F) - a chodzi tu o to, że (w przeciwieństwie do dwu/trzy bajtowych) konwertują się one (z przyjętego założenia) 1 do 1 (a nie 2/3 do 2).

      Czyli w koncepcji można by konwertować dowolny tekst z UTF?
      Tak, z jednym zastrzeżeniem - taki tekst ale bez kodu 0x7F (DEL). Dodatkowo też, przynajmniej w wersji pakera na Atari, jaki bym przewidywał do zrobienia (przerabiając paker Jaskiera - będąc konkretnym tu i precyzyjnym) teksty złożone wyłacznie z kodów w zakresie do U+0x7FF (tylko dwubajtowe znaki, nie większe).

      Z konkretów, to zdecyduję się na rozpiskę tego, jak widziałbym kodowanie znaków językowych (U+0x80 + ). Przyznam się tu, że jestem z niej zadowolony (ostatnio przemodelowałem koncepcję sprzed ponad roku).

      %0 xxxxx(5) U+0x00…1F (6+6 ,-4)
      %10 1xxxxxxx(7) U+0x080…0FF (6+10 ,0)
      %10 0xxxxxxx(7) U+0x100…17F (6+10 ,0)

      %11 001 xxxxxxx(7) U+0x180…1FF (6+12 ,-2)
      %11 xxx(3)>1 xxxxxxxx(8) U+0x200…7FF (6+13 ,-3)
      %11 000 xxxxx(5)>0 xxx(3) x…x(8) U+0x0800…FFFF (6+21 ,-3)
      %11 000+00000(8) 0xxx(3) x…x(16) U+0x010000…10FFFF (6+30 ,-4)
      %11 000+00000(8) 1 ??

      W ostatnim nawiasie w wieszu jest zsumowanie długości zapisu w bitach w koncepcji pakera, a po przecinku porównanie z wielkością w oryginalnym zapisie znaku z tego samego zakresu znaków UTF. "6+" (stała składowa) to liczba bitów wejścia w tą logikę.

      Może rozpiska nie jest najklarowniejsza i nazbyt popranie skonstruowana (nie mam tu kompetencji), ale myślę, że ogólnie do odczytania.

      Kontynuując omówienie, ogólnie "idzie się w stratę", przy czym warto zauważyć że znaki językowe, które "mają branie" (zn. polskie, itp.), wychodzą w bilansie na zero. Najgorzej traci się tu na znaku końca linii (bo jego częstość występowania w tekście). Ogólnie w całościowym bilansie kodowania znaków ma się to z nadwyżką kompensować.


      Oprócz tego całościowy format kodowania znaków to forma z założenia nawet "wymienna" w tym sensie, że możliwa do osobnego podstawienia.
      Z tego samego względu, format pakera nie jest koncepcyjnie zamykany jedynie do zastosowania z tekstami z UTF (ograniczenia związane z używaniem kodów > 0x80), ale o tyle otwarty dla dowolnych danych, na ile ktoś uzna to za celowe, sensowne i możliwe, by na bazie tego kodu który zastanie dobudować (trudna sprawa) więcej.

      Po prostu pierwsze bity archiwum (minimum dwa) mają być informacyjne, więc istnieje proste rozwiązanie by dobudowywać w całościowej koncepcji formatu coś więcej (ewentualnie korzystając z części rozwiązań/kodu zastanego). Tylko o to chodzi konkretnie z tym "otwartym formatem", o którym futurystycznie i enigmatycznie (dużo) tu piszę (i chyba też nazbyt optymistycznie).