Jaka jest moc alfabetu

z alfabetu w informatyce jest systemem znaków za pomocą którego można przesłać wiadomość informacyjną. Aby zrozumieć istotę tej definicji, podajemy kilka dodatkowych faktów teoretycznych:

  • Wszelkie wiadomości składają się z alfabetu. Na przykład ten artykuł jest wiadomością. Następnie składa się ze znaków n alfabetu.
  • Pod symbolem możemy zrozumieć najmniej znaczącą część alfabetu. Również niepodzielne cząsteczki nazywane są atomami. Symbole w alfabecie rosyjskim to "a", "b", "in" i tak dalej.
  • Teoretycznie alfabet niekoniecznie musi być zakodowany. Na przykład w książce drukowanej alfabetu myśli siebie, więc nie ma żadnego kodowania.
  • Ale w praktyce mamy następujące: komputer nie rozumie, jakie są litery. Dlatego, aby przenieść alert, musi najpierw być kodowane komputerowy język zrozumiały. Aby przejść dalej, musisz wprowadzić dodatkowe warunki.

    Jaka jest pojemność alfabetu

    w charakterze alfabetu rozumie się całkowitą liczbę znaków w nim. Aby dowiedzieć się, jaka moc alfabetu, wystarczy policzyć liczbę znaków w nim. Rozumiem. W przypadku alfabetu rosyjskiego moc alfabetu wynosi 33 lub 32 znaki, jeśli nie używa się "e". Załóżmy, że wszystkie symbole w naszym alfabecie są równie prawdopodobne. Założenie to można rozumieć jako: załóżmy, że mamy torbę z podpisanymikostki Liczba zawartych w nim kostek jest nieskończona, a każda z nich jest podpisana tylko jednym znakiem. Następnie, przy równomiernym rozmieszczeniu, bez względu na to, jak bardzo zdobędziemy kostki z torby, liczba kostek z różnymi symbolami będzie taka sama, lub będzie starała się to zrobić wraz ze wzrostem liczby kostek, które otrzymujemy z torby.

    Oszacowanie wagi wiadomości informacyjnych

    Prawie sto lat temu amerykański inżynier Ralph Hartley wyprowadził formułę, dzięki której można oszacować ilość informacji w wiadomości. Jego formuła działa dla zdarzeń probabilistycznych i wygląda następująco: i = log 2 M Gdzie i - liczba niepodzielnych informacji atomów (bitów) w komunikacie, "M" - moc alfabetu. Chodźmy dalej. Za pomocą przekształceń matematycznych możemy określić, że moc alfabetu można obliczyć w następujący sposób:

    M = 2 i Ta formuła ogólnie określa związek między liczbą równie prawdopodobnego zdarzenia "M" a ilością informacji "i".

    Obliczamy moc

    Najprawdopodobniej już wiesz ze szkolnego kursu informatyki, że w nowoczesnych systemach komputerowych zbudowanych na architekturze von Neumanna używa się binarnego systemu kodowania. Koduje zarówno aplikacje, jak i dane. Aby przedstawić tekst w systemie komputerowym, należy użyć jednolitego kodu składającego się z ośmiu cyfr. Przyjmuje się, że jednolity kod zawiera stały zestaw elementów - 0 i 1. Wartości w takim kodzie są określone przez pewną kolejność tych elementów. Dzięki ośmiobitowym kodom możemy kodować wiadomości o długości 256 bitów, zgodnie z formułąHartley: M 8 = 2 8 = 256 bitów informacji. Taka sytuacja z kodowaniem znaków binarnych ukształtowała się historycznie. Ale teoretycznie możemy użyć innych alfabetów do reprezentowania danych. Na przykład, w chetыrehznakovom alfabetu, każda postać będzie masie nie jednego, ale dwóch bitów w vosmyznakovom - 3 bity i tak dalej. Oblicza się ją za pomocą binarnego logarytm, która została opisana powyżej (i = log 2 M).
    Ponieważ pojemności alfabetu 256 bitów do wskazania jednego znaku podano osiem bitów, zdecydowano się na wprowadzenie dodatkowego środka informacji - bajty. Jeden bajt zawiera jeden znak tablicy kodów ASCII i zawiera osiem bitów.

    Jak zmierzyć informacji

    Vosmibit Wyspa wiadomości tekstowych Kodowanie używane w tabeli kodów ASCII, aż podstawowego zestawu znaków łacińskiego i cyrylicy w małych liter i wersji wiersza, liczby, znaki interpunkcyjne i innych podstawowych symboli. W celu zmierzenia dużych ilości danych za pomocą specjalnych prefiksów słów bajtów i bitów. Takie konsole są podane w poniższej tabeli:
    Wielu ludzi, którzy studiowali fizykę sprzeciwiło się, że rozsądnie byłoby, aby skorzystać z klasycznej konsoli do wskazania jednostek informacji (jak kilo - i mega-), ale to nie jest do końca poprawne, ponieważ te przedrostki do określenia wartości mnożenia do konkretnego stopień numer dziesięć, kiedy nauka służy pomiary systemowe wszędzie binarnych.

    Prawidłowe nazwy jednostek pomiaru danych

    W celu wyeliminowanianieprawidłowości i niedogodności, w marcu 1999 r. Międzynarodowa Komisja ds. Elektrotechniki zatwierdziła nowe jednostki dla jednostek wykorzystywanych do określenia ilości informacji w elektronice komputerowej. Takie przedrostki to "mebia", "kibi", "gibi", "tebi", "eksby", "pety". Dopóki te jednostki nie dojdą do skutku, prawdopodobnie potrzebny jest czas na wdrożenie tego standardu i upowszechnienie go. Jak dokonać przejścia z klasycznych jednostek do nowo zatwierdzonych, możesz zdefiniować w poniższej tabeli:

    Załóżmy, że mamy tekst zawierający znaki K. Następnie za pomocą podejścia alfabetycznego można obliczyć ilość informacji V w nim zawartych. Będzie równy mocy produktu alfabetu do wagi informacji jednego znaku w nim. Według formuły Hartleya wiemy, jak obliczyć ilość informacji za pomocą logarytmu binarnego. Zakładając, że liczba znaków w alfabecie wynosi N, a liczba znaków w rekordzie informacji o komunikacie to K, otrzymamy następującą formułę obliczania objętości komunikatu: V = K? log 2 N Podejście alfabetyczne pokazuje, że ilość informacji zależy tylko od pojemności alfabetu i wielkości wiadomości (to jest liczby znaków w niej), ale nie będzie związana z treścią semantyczną dla danej osoby.

    Przykłady obliczania mocy

    Zajęcia z informatyki często dają zadanie znalezienia potęgi alfabetu, długości wiadomości lub objętości informacji. Oto jedno z następujących zadań:"Plik tekstowy zajmuje 11 kilobajtów przestrzeni dyskowej i zawiera 11264 znaków. Określ moc alfabetu tego pliku tekstowego." Jakie rozwiązanie będzie można zobaczyć na poniższym obrazku.
    Zatem alfabet o pojemności 256 znaków zawiera tylko 8 bitów informacji, które w informatyce nazywa się jeden bajt. Bajt opisuje 1 znak tabeli ASCII, który, jeśli myślisz, nie jest dużo.

    Jeden bajt - czy to dużo, czy nie?

    Nowoczesne hurtownie danych w przykładowych centrach danych Google i Facebook zawierają nie mniej niż dziesiątki petabajtów informacji. Dokładna ilość danych będzie jednak trudna do obliczenia nawet dla siebie, ponieważ wtedy trzeba będzie zatrzymać wszystkie procesy na serwerach i zamknąć użytkowników, aby uzyskać dostęp do nagrywania i edycji swoich danych osobowych.
    Ale aby wyobrazić sobie tak niewyobrażalne ilości danych, trzeba wyraźnie zrozumieć, że wszystko składa się z drobnych szczegółów. Konieczne jest zrozumienie, dlaczego moc alfabetu jest równa (256) i ile bitów zawiera 1 bajt informacji (jak sobie przypominasz, 8).

    Powiązane publikacje