Odwrotna notacja polska
Kolejność wykonywania działań to, jak można zauważyć w Internecie, jeden z największych problemów, jakie przeciętne osoby mają z matematyką. Regularnie od wielu lat pojawia się w mediach społecznościowych jakiś wariant zagadki „oblicz 6/2(2+1)”, gdzie ludzie się kłócą, czyja odpowiedź jest prawidłowa. W idealnym świecie takich problemów nie powinno być. Dlatego powstały alternatywne sposoby zapisu działań matematycznych pozbywające się nawiasów, takie jak np. odwrotna notacja polska. Nasz świat idealnym jednak nie jest, więc męczymy się z nawiasami, ale poznajmy tę notację, bo akurat w świecie informatyki ma ona duże znaczenie.
Sposoby zapisu wyrażeń matematycznych
Zanim przejdziemy do sedna artykułu, czyli odwrotnej notacji polskiej, opowiem trochę o innych sposobach zapisu wyrażeń matematycznych, czyli notacji infiksowej oraz notacji polskiej.
Notacja infiksowa
Ta słynna notacja z nawiasami, którą wszyscy się posługujemy, zapisując wyrażenia matematyczne, nazywa się fachowo notacją infiksową lub czasem w polskiej literaturze znajdziemy nazwę zapis wrostkowy.
Schematycznie moglibyśmy tę notację przedstawić następująco:
Operacje wykonujemy w następującej kolejności:
- Najpierw potęgujemy i pierwiastkujemy.
- Następnie mnożymy i dzielimy.
- Na samym końcu wykonujemy dodawanie i odejmowanie.
Jeśli mamy operacje tego samego typu, wykonujemy je od lewej do prawej. Natomiast jeśli chcielibyśmy tą kolejność zaburzyć, stosujemy nawiasy, których rozwiązanie ma wyższy priorytet niż wszystkie opisane wyżej operacje.
Na przykład słynne działanie, które podałem we wstępie, rozwiążemy następująco:
Notacja polska
Inne podejście do zapisu wyrażeń przedstawił w 1920 r. Jan Łukasiewicz i jest dziś znane jako notacja polska, notacja prefiksowa lub zapis przedrostkowy. Eliminuje konieczność stosowania nawiasów i jest bardziej zbliżone do naturalnego opisywania wyrażeń językiem opisowym.
Rozpatrzmy jako przykład wyrażenie pokazane wyżej, czyli . Jeśli chcielibyśmy opisać je słownie, powiedzielibyśmy:
Pomnóż iloraz sześciu i dwa przez sumę dwu i jeden.
Przekłada się to bezpośrednio na następujący zapis w notacji polskiej:
Działania w notacji polskiej rozwiązujemy tak, że przechodzimy od lewej do prawej. Jeśli napotkamy na operator i dwa kolejne elementy są liczbami, to wykonujemy działanie. W przeciwnym wypadku przechodzimy dalej w prawo. Powyższy przypadek rozwiązalibyśmy następująco:
Na tej notacji w artykule nie będziemy się skupiać, aczkolwiek warto wspomnieć, że o ile w matematyce się jej nie spotyka, to znalazła zastosowanie w informatyce. Osoby, które miały do czynienia z programowaniem funkcyjnym, mogą tutaj zauważyć podobieństwo do S-wyrażeń (S-expression) znanych z Lispa. Jest to skojarzenie poprawne, bo S-wyrażenia są zapisywane właśnie w notacji polskiej.
Poniżej możesz zobaczyć różne proste rzeczy napisane w Common Lisp. Zwróć uwagę na ten charakterystyczny zapis, że zawsze z lewej strony zapisujemy operację, a po prawej jej argumenty.
;;; wypisanie wartości 2+2
(write-line (write-to-string (+ 2 2)))
;;; funkcja podnosząca liczbę do kwadratu oraz jej użycie
(defun square (x)
(* x x))
(write-line (write-to-string (square 4)))
;;; funkcja rekurencyjna licząca silnię oraz jej użycie
(defun factorial (n)
(if (< n 2) 1
(* n (factorial (- n 1)))))
(write-line (write-to-string (factorial 6)))
Obecne tutaj nawiasy nie mają takiej funkcji jak w matematyce w zapisie infiksowym. Nawiasy wyznaczają listy, ponieważ jest to podstawowa struktura danych w Lisp i wszystko w nim jest listą. Kod w praktyce możesz sprawdzić na Replit.
Mimo że notacja polska jest istotna w informatyce, choćby właśnie ze względu na S-wyrażenia, to w tym artykule akurat nie chcę poświęcać jej więcej uwagi.
Odwrotna notacja polska
Zdecydowanie większe znaczenie w informatyce, szczególnie w algorytmice, ma odwrotna notacja polska (inaczej: notacja postfiksowa; w skrócie: ONP). Niestety nie podam, kto był jej oryginalnym autorem — koncepcja została opracowana kilkakrotnie w niezależny sposób. Jej najstarsze użycie datuje się na 1941 r., ponieważ znalazła zastosowanie w niemieckim komputerze Z3.
Nazwa wywodzi się stąd, że jest to odwrócenie notacji polskiej. Gdy w notacji polskiej najpierw pisaliśmy operator, a po nim liczby, tak tutaj jest na odwrót. Działania wykonujemy od lewej do prawej i jeśli trafimy na operator, to zbieramy dwie poprzedzające go liczby i wykonujemy operację.
Kontynuując nasz ulubiony przykład , w ONP zostanie ona zapisana następująco:
A jak wyglądałoby obliczenie tego na kartce, nie znając jeszcze konkretnych algorytmów? Znając regułę, którą opisałem powyżej, moglibyśmy zrobić to następująco:
Odwrotna notacja polska jest o tyle istotna, że wyrażenia nią zapisane są najprostsze do obliczenia algorytmicznie. Z tego też powodu od pierwszych lat komputerów i elektronicznych kalkulatorów możemy znaleźć ten rodzaj zapisu. W kwestii algorytmiki wygląda to tak, że wyrażenia zapisane tradycyjnie notacją infiksową najpierw przekształca się do ONP, a dopiero wtedy oblicza. Natomiast jeśli chodzi o kalkulatory, to szczególnie znane są te od firmy Hewlett-Packard, przede wszystkim HP-12C, który był chyba najbardziej znanym kalkulatorem finansowym, gdzie operacje wpisywano za pomocą ONP. Notacja ta wśród profesjonalistów jest o tyle popularna, że nawet dzisiejsze profesjonalne kalkulatory mają tryb wprowadzania w niej.
Obliczanie wyrażeń w ONP
Napisałem, że odwrotna notacja polska umożliwia proste obliczanie wyrażeń algorytmicznie. W takim razie zobaczmy, jak napisać taki algorytm.
Stos
Zanim jednak przejdziemy do właściwego algorytmu, muszę wprowadzić prostą strukturę danych, którą wykorzystamy w nim jako pamięć do przechowywania liczb i operacji — stos. Miałem już okazję opisać, czym on jest, w artykule o derekursywacji, ale dla formalności opiszę krótko jeszcze raz.
Stos to nic innego jak szczególny przypadek listy. Charakteryzuje się tym, że elementy możemy dodawać jedynie na początek, a usuwać (i tym samym odczytywać) tylko z początku. Stąd inna, angielska nazwa Last In, First Out (LIFO, z ang. ostatni na wejściu, pierwszy na wyjściu). Struktura ta ma wiele zastosowań, bo bardzo często potrzebujemy przechować jakieś dane i odwołać się do ostatnio dodanych. Zresztą zastosowanie tego typu zaraz pokażę w tym artykule.
Klasyczne implementacje stosu oferują trzy operacje:
push
— położenie elementu na stospop
— ściągnięcie elementu ze stosu- sprawdzenie, czy stos jest pusty
Jeśli chodzi o gotowe implementacje, niektóre języki programowania posiadają wbudowane struktury stosów (np. Stack w C#, Deque w Javie). Jeśli nie mamy, stos można bardzo łatwo zasymulować listą tablicową albo wiązaną. Wystarczy jedynie wykonywać operację dodania elementu na koniec/początek i usuwania z niego. W kwestii tego, czy wybrać koniec, czy początek, zależy to od struktury — w przypadku list tablicowych wydajniejsze jest dodawanie na koniec, natomiast w przypadku wiązanych zwykle na początek. Zresztą w przypadku tych pierwszych czasem się nawet zdarza, że operacje dodania i usunięcia elementu z końca nazywają się właśnie push
i pop
(np. w JavaScript).
Opis algorytmu
Przy ręcznym obliczaniu wyrażenia zapisanego w ONP szliśmy w prawo tak długo, aż napotkaliśmy operator, po czym ściągaliśmy do niego liczby, a wynik zapisywaliśmy w miejscu tych liczb i operatora. Podobne zachowanie możemy odwzorować przez odczytywanie wyrażenia symbol po symbolu. Liczby odkładamy na stos, a trafiając na coś, co nie jest liczbą (operator lub funkcja), odczytujemy ze stosu odpowiednią liczbę elementów. Po obliczeniu wyniku odkładamy go na stos. Mając dobrze zapisane wyrażenie, na samym końcu powinniśmy mieć na stosie tylko jedną liczbę, która jest rozwiązaniem wyrażenia.
Sformalizujmy to w postać listy kroków, aby też później można było łatwiej przenieść to na język programowania.
Algorytm na wejściu przyjmuje wyrażenie w ONP (dla uproszczenia załóżmy, że mamy je rozdzielone na tablicę poszczególnych symboli). Na wyjściu otrzymujemy liczbę, która jest wynikiem wyrażenia.
- Utwórz stos.
- Dla każdego symbolu w wyrażeniu:
- Jeśli symbol jest liczbą, odłóż go na stos.
- Jeśli symbol jest operatorem:
- Zdejmij ze stosu element; nazwijmy go
a
. - Zdejmij ze stosu element; nazwijmy go
b
. - Wykonaj działanie
b <operator> a
. - Dodaj wynik powyższej operacji na stos.
- Zdejmij ze stosu element; nazwijmy go
- Zdejmij wartość ze stosu i ją zwróć.
Powyżej dałem tylko najpopularniejszy przypadek, gdzie w wyrażeniu mamy jedynie operatory dwuargumentowe. W przypadku jeśli mielibyśmy też funkcje, albo operatory jednoargumentowe, to w punkcie 2.2.1. należy ściągać ze stosu odpowiednią liczbę elementów. Trzeba tylko pamiętać (w przypadku funkcji), że argumenty odczytujemy od tyłu, tzn. ostatnio odczytany ze stosu będzie pierwszym, przedostatni drugim itd.
Przykład rozwiązania
Sprawdźmy teraz powyższy algorytm na kartce, rozwiązując nim , czyli w odwrotnej notacji polskiej .
- Najpierw odczytujemy symbol
6
. Jest to liczba, więc wrzucamy na stos. Zawartość stosu:[6]
. - Kolejny symbol to
2
. Również wrzucamy na stos. Zawartość stosu:[2, 6]
. - Następnie odczytujemy operator
/
. W takim razie wykonujemy następujące operacje:- Ściągamy ze stosu liczbę:
a = 2
. Zawartość stosu:[6]
. - Ściągamy kolejną liczbę ze stosu:
b = 6
. Zawartość stosu:[]
. - Wykonujemy działanie
b / a = 6 / 2 = 3
. Wynik dodajemy na stos. Zawartość stosu:[3]
.
- Ściągamy ze stosu liczbę:
- Odczytujemy liczbę
2
, którą wrzucamy na stos. Zawartość stosu:[2, 3]
. - Odczytujemy liczbę
1
, którą również dodajemy na stos. Zawartość stosu:[1, 2, 3]
. - Następnie odczytujemy operator
+
. Wykonujemy więc:- Ściągamy ze stosu liczbę:
a = 1
. Zawartość stosu:[2, 3]
. - Ściągamy ze stosu liczbę:
b = 2
. Zawartość stosu:[3]
. - Wykonujemy działanie
b + a = 2 + 1 = 3
. Wynik dodajemy na stos. Zawartość stosu:[3, 3]
.
- Ściągamy ze stosu liczbę:
- Odczytujemy operator
*
. Wykonujemy:- Ściągamy ze stosu liczbę:
a = 3
. Zawartość stosu:[3]
. - Ściągamy ze stosu liczbę:
b = 3
. Zawartość stosu:[]
. - Wykonujemy działanie
b * a = 3 * 3 = 9
. Wynik dodajemy na stos. Zawartość stosu:[9]
.
- Ściągamy ze stosu liczbę:
- Ściągamy wartość ze stosu. Wynik obliczeń to:
9
.
Implementacja ONP w kodzie
Pokazany wyżej algorytm możemy bardzo łatwo przenieść na kod. Najprostsza implementacja w JavaScript zakładająca jedynie cztery podstawowe operacje dwuargumentowe mogłaby wyglądać następująco:
// zakładamy, że wyrażenie jest tablicą stringów
function solve(expression) {
// inicjujemy stos jako listę tablicową
const stack = [];
// dla każdego symbolu w wyrażeniu...
for (const symbol of expression) {
// jeśli symbol jest operatorem
if (['+', '-', '*', '/'].includes(symbol)) {
// zdejmujemy wartości ze stosu
const a = stack.pop();
const b = stack.pop();
// wykonujemy odpowiednią operację
let result;
switch (symbol) {
case '+': result = b + a; break;
case '-': result = b - a; break;
case '*': result = b * a; break;
case '/': result = b / a; break;
}
// dodajemy wynik na stos
stack.push(result);
} else {
// w przypadku gdy jest liczbą, dodajemy go na stos
// od razu konwertujemy na typ liczbowy
stack.push(parseFloat(symbol));
}
}
// zwracamy wartość, która została odłożona na szczycie stosu
return stack.pop();
}
Kod możesz przetestować na Replit. Możesz go też przetestować poniżej. Wpisz działanie i zobacz, jak krok po kroku oblicza się jego wynik.
Podsumowanie
Odwrotna notacja polska jest nieco mniej intuicyjnym zapisem niż powszechnie stosowany infiksowy, ale jak mogłeś(-aś) zobaczyć w tym artykule, bardzo prostym do obliczenia algorytmicznie. Sam algorytm obliczania można też bardzo łatwo rozbudować, więc jeśli byłaby potrzeba obsłużenia również funkcji (sinus, cosinus itd.) czy innych operacji znanych z kalkulatorów (np. pierwiastkowanie), to nie będzie z tym problemu.
Literatura
- Polish notation, https://en.wikipedia.org/w/index.php?title=Polish_notation&oldid=1139119735 (ostatnia wizyta 11.04.2023).
- S-expression, https://en.wikipedia.org/w/index.php?title=S-expression&oldid=1146125353 (ostatnia wizyta 11.04.2023).
- RPN, https://www.hpmuseum.org/rpn.htm (ostatnia wizyta 11.04.2023).
- McIlroy, Mark. "Reverse Polish Notation." From MathWorld--A Wolfram Web Resource, created by Eric W. Weisstein. https://mathworld.wolfram.com/ReversePolishNotation.html