Olando schemos teorema, dar vadinama pagrindine genetinių algoritmų teorema, aprašo, kaip tam tikros bitų eilutės (ar kitos genotipo reprezentacijos) struktūros — vadinamos schemos — keičiasi per kartas atliekant atranką, kryžminimą ir mutaciją genetiniame algoritme. Teoremą XX a. aštuntajame dešimtmetyje pasiūlė Johnas Hollandas. Jos intencija buvo paaiškinti, kodėl trumpi, žemos eilės ir aukšto tinkamumo schemos gali daugintis populiacijoje ir taip sudaryti sudėtingus sprendimus iš paprastų fragmentų. Teorija ilgą laiką buvo laikoma pagrindine genetinių algoritmų galiai paaiškinti, tačiau vėlesnės analizės parodė, kad jos interpretacija turi ribotumų ir gali būti suprasta tik kaip apibūdinimas, o ne griežtas priežasties įrodymas.

Kas yra schema?

Schema — tai šablonas, apibrėžiantis genotipo pozicijų kombinaciją, kur tam tikrose pozicijose reikšmės yra užfiksuotos, o kitose paliekama „nepaisoma“ (dažnai žymima simboliu *). Pavyzdžiui, binarinėje eilutėje schema 1*0* reiškia visas eilutes, kurių pirmas bitas yra 1, trečias bitas — 0, o antras ir ketvirtas bet kokie. Schema apibrėžia tam tikrą eilučių aibę (poaibis), ir, taikant simbolinę topologiją, schemos dažnai laikomos cilindrinių aibių atveju, todėl jos gali būti analizuojamos kaip sudedamoji topologinė erdvė.

Matematinė išraiška (supaprastinta forma)

Schemas teorema pateikia nelygybę, kuri apytiksliai prognozuoja schemos populiacijose gausėjimą arba mažėjimą po vienos kartos, kai veikia atranka, kryžminimas ir mutacija. Tipinė supaprastinta forma rašoma taip:

m(H, t+1) ≥ m(H, t) * (f(H)/f̄) * (1 - p_c * (δ(H)/(l-1)) - p_m * o(H)),

  • m(H, t) — schemos H individų skaičius arba dažnis laike t,
  • f(H) — vidutinis schemos H tinkamumas,
  • f̄ — visos populiacijos vidutinis tinkamumas,
  • p_c — kryžminimo tikimybė,
  • p_m — vieno geno mutacijos tikimybė,
  • o(H) — schemos eilė (fiksuotų pozicijų skaičius),
  • δ(H) — apibrėžimo ilgis (tarpas tarp pirmos ir paskutinės fiksuotos pozicijos),
  • l — viso genotipo ilgis.

Ši nelygybė rodo, kad, esant didesniam nei vidutinis tinkamumui (f(H) > f̄), trumpų (mažas δ(H)) ir žemos eilės (mažas o(H)) schemų lūkesčiu didėjimas yra palankesnis. Tačiau formulė yra apytikslė ir grindžiama tam tikromis prielaidomis (pvz., atranka proporcinga tinkamumui, nepriklausomi operatorių poveikiai), todėl realiose situacijose gali būti nukrypimų.

Reikšmė genetiniuose algoritmuose

Schemos teorema suteikia intuityvų paaiškinimą, kodėl genetiniai algoritmai gali „sudėlioti“ gerus sprendimus iš mažesnių fragmentų (vadinamųjų building blocks): trumpi, informatyvūs fragmentai, kurie užtikrina aukštą tinkamumą, turėtų išlikti ir daugintis. Tai padeda formuoti praktinius principus, pvz., kodavimo ir operatorių (kryžminimo, mutacijos) parinkimą taip, kad būtų saugomos naudingos lokalinės struktūros.

Apribojimai ir kritika

Nors Schemos teorema yra galingas analitinis įrankis, svarbu suprasti jos ribotumus:

  • Ji yra nelygybė, o ne tiksli lygtis — pateikiamas lūkestis, o ne garantija.
  • Daroma keletas supaprastinančių prielaidų (pvz., nepriklausomi operatorių poveikiai, proporcionalios atrankos sąlyga), kurios ne visada tenkinamos praktikoje.
  • Teorema nenurodo, kaip greitai ar kokiu mastu schemos derėsis tarpusavyje arba kaip susiformuos pilni sprendimai — ji nurodo tik fragmentų gausėjimo linkmę.
  • Vėlesnės studijos, įskaitant rodymą, kad Schemos teorema yra Price'o lygties specialus atvejis (kai schemos indikatoriaus funkcija yra makroskopinis matas), pabrėžė, jog teoremos interpretacija kaip pagrindinio „building-block“ mechanizmo įrodymo yra pernelyg supaprastinta.

Praktiniai patarimai

Remiantis schemos idėja, praktikoje rekomenduojama:

  • Parinkti tokią genotipo reprezentaciją, kad svarbios savybės būtų suspaustos į trumpus fragmentus (sumažinti δ(H)).
  • Naudoti operatorius, kurie nesunaikina trumpų naudingų fragmentų (pavyzdžiui, tinkamas kryžminimo tipas arba reguliuoti p_c ir p_m reikšmes).
  • Analizuoti ne tik vidutinius tinkamumus, bet ir dispersiją bei koreliacijas tarp genų — realus elgesys gali skirtis nuo paprastų prognozių.

Išvados

Schemos teorema išlieka svarbus konceptualus įrankis, suteikiantis įžvalgų apie tai, kaip genetiniai algoritmai gali konstruoti sudėtingas sprendimų dalis iš paprastų fragmentų. Tačiau ją reikėtų naudoti atsargiai: tai apibūdinamojo pobūdžio rezultatas su aiškiais apribojimais, o jos pastangos paaiškinti GA sėkmę turi būti derinamos su kitomis teorijomis ir empiriniu testavimu.