Konfliktusvezérelt klóztanulás
Az informatikában a konfliktusvezérelt klóztanulás (CDCL) a logikai kielégítési probléma (SAT) megoldására szolgáló algoritmus. Adott egy logikai képlet, a SAT-probléma változók hozzárendelését kéri, hogy a teljes képlet igaz legyen. A CDCL SAT megoldók belső működését a DPLL megoldók ihlették. A fő különbség a CDCL és a DPLL között az, hogy a CDCL visszaugrása nem kronologikus.
A konfliktusvezérelt klózok tanulását Marques-Silva és Sakallah (1996, 1999),[1][2] valamint Bayardo és Schrag (1997) javasolta.[3]
Háttér
[szerkesztés]Logikai kielégítési probléma
[szerkesztés]A kielégítési probléma abban áll, hogy egy adott képlethez megfelelő hozzárendelést találunk konjunktív normál formában (CNF).
vagy egy általános jelöléssel:[4]
ahol A, B, C logikai változók, , , , és litárlok, és és klózok.
mivel igazzá teszi az első klózt (hiszen igaz), valamint a másodikat (mivel igaz).
Ez a példa három változót használ ( A, B, C ), és mindegyikhez két lehetséges hozzárendelés (igaz és hamis) van. Tehát az egyiknek van lehetősége. Ebben a kis példában a brute-force keresést használhatjuk az összes lehetséges hozzárendelés kipróbálásához, és ellenőrizhetjük, hogy megfelelnek-e a képletnek.
De realisztikus alkalmazásokban, amelyekben milliónyi változó és klóz található, a brute force keresés nem praktikus. A SAT-megoldó feladata, hogy hatékonyan és gyorsan megtalálja a kielégítő feladatot összetett CNF-képletek különböző heurisztikáinak alkalmazásával.
Unit klóz szabály (unit propagáció vagy egységterjesztés)
[szerkesztés]Ha egy nem kielégítő klóznak egy kivételével minden literálja vagy változója Hamis értékkel van kiértékelve, akkor a szabad literálnak igaznak kell lennie ahhoz, hogy a klóz igaz legyen. Például, ha az alábbi nem kielégítő klózt a következővel értékeljük ki és nekünk kell hogy legyen a klóz érdekében hogy igaz legyen.
A unit klóz szabály iterált alkalmazását unit propagációnak vagy Boole-kényszer-propagációnak (BCP) nevezik.
Vegyünk két kitételt és . A klóz , amelyet a két klóz egyesítésével és mindkettő eltávolításával kapunk és , a két klóz oldójának nevezzük.
Algoritmus
[szerkesztés]A konfliktus-vezérelt klózok tanulása a következőképpen működik.
- Válasszon ki egy változót, és rendelje hozzá az igaz vagy hamis értéket. Ezt döntési állapotnak nevezik. Emlékezzen a feladatra.
- Alkalmazza a logikai kényszer propagációt (unit propagáció).
- Építsd meg az implikációs gráfot.
- Ha bármilyen konfliktus van
- Keresse meg az implikációs grafikonon azt a vágást, amely az ütközéshez vezetett
- Hozz létre egy új klózt, amely a konfliktushoz vezető hozzárendelések tagadása
- Nem kronologikusan visszalépni ("visszaugrás") a megfelelő döntési szintre, ahol az elsőként hozzárendelt, a konfliktusban érintett változót hozzárendelték
- Ellenkező esetben folytassa az 1. lépéstől, amíg az összes változóértéket hozzá nem rendeli.
Példa
[szerkesztés]A CDCL algoritmus vizuális példája:[4]
-
Első elágazó változónál válasszuk az x1-et. A sárga kör tetszőleges döntést jelent.
-
Most alkalmazza a unit propagációt, ami azt eredményezi, hogy x4-nek 1-nek kell lennie (azaz igaznak). A szürke kör a unit propagáció során kényszerített változó hozzárendelést jelent. Az így kapott gráfot implikációs gráfnak nevezzük.
-
Tetszőlegesen válasszon másik elágazó változót, az x3-at.
-
Alkalmazza a unit propagációt, és keresse meg az új implikációs gráfot.
-
Itt az x8 és x12 változók 0-ra, illetve 1-re vannak kényszerítve.
-
Válasszon egy másik elágazó változót, x2.
-
Keresse meg az implikációs gráfot.
-
Válasszon egy másik elágazási változót, az x7-et.
-
Keresse meg az implikációs gráfot.
-
Talált konfliktust!
-
Keresse meg azt a vágást, amely ehhez a konfliktushoz vezetett. A vágásból keressen egy ellentétes állapotot.
-
Vegyük ennek a feltételnek a tagadását, és tegyük klózzá.
-
Konfliktus klóz hozzáadása a problémához.
-
Nem időrendi backtrack a megfelelő döntési szintre, amely ebben az esetben a tanult klóz literáljainak második legmagasabb döntési szintje.
-
Visszaugrás és változó értékek beállítása ennek megfelelően.
Teljesség
[szerkesztés]A DPLL egy megbízható és teljes algoritmus a SAT számára. A CDCL SAT megoldói megvalósítják a DPLL-t, de megtanulhatnak új klózokat, és nem kronologikusan léphetnek vissza. A konfliktuselemzéssel végzett klóztanulás nem befolyásolja sem a megalapozottságot, sem a teljességet. Az új klózokat feloldási művelettel azonosítja az ütközéselemzés. ezért minden egyes tanult klóz kikövetkeztethető az eredeti klózból és a többi tanult klózból a feloldási szekvencia sorozatával. Ha cN az új tanult klóz, akkor ϕ akkor és csak akkor teljesíthető, ha ϕ ∪ {cN} is kielégíthető. Ezen túlmenően a módosított backtrack lépés sem befolyásolja a megbízhatóságot vagy a teljességet, mivel a visszalépési információkat minden új tanult klózból kapjuk.[5]
Alkalmazások
[szerkesztés]A CDCL algoritmus fő alkalmazása a különböző SAT-megoldókban található, beleértve:
- MiniSAT
- Zchaff SAT
- Z3
- Glükóz[6]
- ManySAT stb.
A CDCL algoritmus annyira erőssé tette a SAT-megoldókat, hogy számos alkalmazási területen alkalmazzák hatékonyan a gyakorlatban, mint például a mesterséges intelligencia tervezése, bioinformatika, szoftverteszt-minta generálása, szoftvercsomag-függőségek, hardver- és szoftvermodell-ellenőrzés és kriptográfia.
Kapcsolódó algoritmusok
[szerkesztés]A CDCL-hez kapcsolódó algoritmusok a Davis–Putnam-algoritmus és a DPLL algoritmus. A DP algoritmus rezolúció cáfolatokat használ, és lehetséges memóriaelérési problémája van. Míg a DPLL algoritmus megfelelő a véletlenszerűen generált példányokhoz, rossz a gyakorlati alkalmazásokban generált példányokhoz. A CDCL hatékonyabb megoldás az ilyen problémák megoldására, mivel a CDCL alkalmazása kevesebb állapottér-keresést biztosít a DPLL-hez képest.
-
DPLL: nincs tanulás és időrendi visszalépés (backtrack).
-
CDCL: konfliktus-vezérelt záradéktanulás és nem – kronologikus visszalépés.
Jegyzetek
[szerkesztés]- ↑ J.P. Marques-Silva. GRASP-A New Search Algorithm for Satisfiability, Digest of IEEE International Conference on Computer-Aided Design (ICCAD), 220–227. o.. DOI: 10.1109/ICCAD.1996.569607 (1996. november 1.). ISBN 978-0-8186-7597-3
- ↑ J.P. Marques-Silva (1999. május 1.). „GRASP: A Search Algorithm for Propositional Satisfiability”. IEEE Transactions on Computers 48, 506–521. o. [2016. március 4-i dátummal az eredetiből archiválva]. DOI:10.1109/12.769433. (Hozzáférés: 2023. május 27.)
- ↑ Roberto J. Bayardo Jr.. Using CSP look-back techniques to solve real world SAT instances, Proc. 14th Nat. Conf. on Artificial Intelligence (AAAI), 203–208. o. (1997)
- ↑ a b In the pictures below, "" is used to denote "or", multiplication to denote "and", and a postfix "" to denote "not".
- ↑ Biere, Heule, Van Maaren, Walsh. Handbook of Satisfiability. IOS Press, 138. o. (2009. február 1.). ISBN 978-1-60750-376-7
- ↑ Glucose's home page
Fordítás
[szerkesztés]Ez a szócikk részben vagy egészben a Conflict-driven clause learning című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.
Források
[szerkesztés]- Martin Davis (1960). „A Computing Procedure for Quantification Theory”. J. ACM 7, 201–215. o. DOI:10.1145/321033.321034.
- Martin Davis (1962. július 1.). „A machine program for theorem-proving”. Communications of the ACM 5, 394–397. o. DOI:10.1145/368273.368557.
- Matthew W. Moskewicz. Chaff: engineering an efficient SAT solver, Proc. 38th Ann. Design Automation Conference (DAC), 530–535. o. (2001)
- Lintao Zhang. Efficient conflict driven learning in a boolean satisfiability solver, Proc. IEEE/ACM Int. Conf. on Computer-aided design (ICCAD), 279–285. o. (2001)
- Presentation – "SAT-Solving: From Davis-Putnam to Zchaff and Beyond" by Lintao Zhang. (Several pictures are taken from his presentation)