{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Dependency Parsing"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"
\n",
"\n",
"This tutorial is available as an IPython notebook at [Malaya/example/dependency](https://github.com/huseinzol05/Malaya/tree/master/example/dependency).\n",
" \n",
"
"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"\n",
"\n",
"This module only trained on standard language structure, so it is not save to use it for local language structure.\n",
" \n",
"
"
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"CPU times: user 6.15 s, sys: 1.31 s, total: 7.46 s\n",
"Wall time: 9.21 s\n"
]
}
],
"source": [
"%%time\n",
"import malaya"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Models accuracy\n",
"\n",
"We use `sklearn.metrics.classification_report` for accuracy reporting, check at https://malaya.readthedocs.io/en/latest/models-accuracy.html#dependency-parsing"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Describe supported dependencies"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"INFO:root:you can read more from https://universaldependencies.org/treebanks/id_pud/index.html\n"
]
},
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" \n",
" Tag \n",
" Description \n",
" \n",
" \n",
" \n",
" \n",
" 0 \n",
" acl \n",
" clausal modifier of noun \n",
" \n",
" \n",
" 1 \n",
" advcl \n",
" adverbial clause modifier \n",
" \n",
" \n",
" 2 \n",
" advmod \n",
" adverbial modifier \n",
" \n",
" \n",
" 3 \n",
" amod \n",
" adjectival modifier \n",
" \n",
" \n",
" 4 \n",
" appos \n",
" appositional modifier \n",
" \n",
" \n",
" 5 \n",
" aux \n",
" auxiliary \n",
" \n",
" \n",
" 6 \n",
" case \n",
" case marking \n",
" \n",
" \n",
" 7 \n",
" ccomp \n",
" clausal complement \n",
" \n",
" \n",
" 8 \n",
" compound \n",
" compound \n",
" \n",
" \n",
" 9 \n",
" compound:plur \n",
" plural compound \n",
" \n",
" \n",
" 10 \n",
" conj \n",
" conjunct \n",
" \n",
" \n",
" 11 \n",
" cop \n",
" cop \n",
" \n",
" \n",
" 12 \n",
" csubj \n",
" clausal subject \n",
" \n",
" \n",
" 13 \n",
" dep \n",
" dependent \n",
" \n",
" \n",
" 14 \n",
" det \n",
" determiner \n",
" \n",
" \n",
" 15 \n",
" fixed \n",
" multi-word expression \n",
" \n",
" \n",
" 16 \n",
" flat \n",
" name \n",
" \n",
" \n",
" 17 \n",
" iobj \n",
" indirect object \n",
" \n",
" \n",
" 18 \n",
" mark \n",
" marker \n",
" \n",
" \n",
" 19 \n",
" nmod \n",
" nominal modifier \n",
" \n",
" \n",
" 20 \n",
" nsubj \n",
" nominal subject \n",
" \n",
" \n",
" 21 \n",
" obj \n",
" direct object \n",
" \n",
" \n",
" 22 \n",
" parataxis \n",
" parataxis \n",
" \n",
" \n",
" 23 \n",
" root \n",
" root \n",
" \n",
" \n",
" 24 \n",
" xcomp \n",
" open clausal complement \n",
" \n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Tag Description\n",
"0 acl clausal modifier of noun\n",
"1 advcl adverbial clause modifier\n",
"2 advmod adverbial modifier\n",
"3 amod adjectival modifier\n",
"4 appos appositional modifier\n",
"5 aux auxiliary\n",
"6 case case marking\n",
"7 ccomp clausal complement\n",
"8 compound compound\n",
"9 compound:plur plural compound\n",
"10 conj conjunct\n",
"11 cop cop\n",
"12 csubj clausal subject\n",
"13 dep dependent\n",
"14 det determiner\n",
"15 fixed multi-word expression\n",
"16 flat name\n",
"17 iobj indirect object\n",
"18 mark marker\n",
"19 nmod nominal modifier\n",
"20 nsubj nominal subject\n",
"21 obj direct object\n",
"22 parataxis parataxis\n",
"23 root root\n",
"24 xcomp open clausal complement"
]
},
"execution_count": 2,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"malaya.dependency.describe()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### List available transformer Dependency models\n",
"\n",
"```python\n",
"def available_transformer(version: str = 'v2'):\n",
" \"\"\"\n",
" List available transformer dependency parsing models.\n",
"\n",
" Parameters\n",
" ----------\n",
" version : str, optional (default='v2')\n",
" Version supported. Allowed values:\n",
"\n",
" * ``'v1'`` - version 1, maintain for knowledge graph.\n",
" * ``'v2'`` - Trained on bigger dataset, better version.\n",
"\n",
" \"\"\"\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"INFO:root:tested on 20% test set.\n"
]
},
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" \n",
" Size (MB) \n",
" Quantized Size (MB) \n",
" Arc Accuracy \n",
" Types Accuracy \n",
" Root Accuracy \n",
" \n",
" \n",
" \n",
" \n",
" bert \n",
" 455.0 \n",
" 114.00 \n",
" 0.820450 \n",
" 0.79970 \n",
" 0.98936 \n",
" \n",
" \n",
" tiny-bert \n",
" 69.7 \n",
" 17.50 \n",
" 0.795252 \n",
" 0.72470 \n",
" 0.98939 \n",
" \n",
" \n",
" albert \n",
" 60.8 \n",
" 15.30 \n",
" 0.821895 \n",
" 0.79752 \n",
" 1.00000 \n",
" \n",
" \n",
" tiny-albert \n",
" 33.4 \n",
" 8.51 \n",
" 0.786500 \n",
" 0.75870 \n",
" 1.00000 \n",
" \n",
" \n",
" xlnet \n",
" 480.2 \n",
" 121.00 \n",
" 0.848110 \n",
" 0.82741 \n",
" 0.92101 \n",
" \n",
" \n",
" alxlnet \n",
" 61.2 \n",
" 16.40 \n",
" 0.849290 \n",
" 0.82810 \n",
" 0.92099 \n",
" \n",
" \n",
"
\n",
"
"
],
"text/plain": [
" Size (MB) Quantized Size (MB) Arc Accuracy Types Accuracy \\\n",
"bert 455.0 114.00 0.820450 0.79970 \n",
"tiny-bert 69.7 17.50 0.795252 0.72470 \n",
"albert 60.8 15.30 0.821895 0.79752 \n",
"tiny-albert 33.4 8.51 0.786500 0.75870 \n",
"xlnet 480.2 121.00 0.848110 0.82741 \n",
"alxlnet 61.2 16.40 0.849290 0.82810 \n",
"\n",
" Root Accuracy \n",
"bert 0.98936 \n",
"tiny-bert 0.98939 \n",
"albert 1.00000 \n",
"tiny-albert 1.00000 \n",
"xlnet 0.92101 \n",
"alxlnet 0.92099 "
]
},
"execution_count": 5,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"malaya.dependency.available_transformer()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Load xlnet dependency model\n",
"\n",
"```python\n",
"def transformer(version: str = 'v2', model: str = 'xlnet', quantized: bool = False, **kwargs):\n",
" \"\"\"\n",
" Load Transformer Dependency Parsing model, transfer learning Transformer + biaffine attention.\n",
"\n",
" Parameters\n",
" ----------\n",
" version : str, optional (default='v2')\n",
" Version supported. Allowed values:\n",
"\n",
" * ``'v1'`` - version 1, maintain for knowledge graph.\n",
" * ``'v2'`` - Trained on bigger dataset, better version.\n",
"\n",
" model : str, optional (default='xlnet')\n",
" Model architecture supported. Allowed values:\n",
"\n",
" * ``'bert'`` - Google BERT BASE parameters.\n",
" * ``'tiny-bert'`` - Google BERT TINY parameters.\n",
" * ``'albert'`` - Google ALBERT BASE parameters.\n",
" * ``'tiny-albert'`` - Google ALBERT TINY parameters.\n",
" * ``'xlnet'`` - Google XLNET BASE parameters.\n",
" * ``'alxlnet'`` - Malaya ALXLNET BASE parameters.\n",
"\n",
" quantized : bool, optional (default=False)\n",
" if True, will load 8-bit quantized model.\n",
" Quantized model not necessary faster, totally depends on the machine.\n",
"\n",
" Returns\n",
" -------\n",
" result: model\n",
" List of model classes:\n",
"\n",
" * if `bert` in model, will return `malaya.model.bert.DependencyBERT`.\n",
" * if `xlnet` in model, will return `malaya.model.xlnet.DependencyXLNET`.\n",
" \"\"\"\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"INFO:root:running dependency-v2/albert using device /device:CPU:0\n"
]
}
],
"source": [
"model = malaya.dependency.transformer(model = 'albert')"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Load Quantized model\n",
"\n",
"To load 8-bit quantized model, simply pass `quantized = True`, default is `False`.\n",
"\n",
"We can expect slightly accuracy drop from quantized model, and not necessary faster than normal 32-bit float model, totally depends on machine."
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"WARNING:root:Load quantized model will cause accuracy drop.\n",
"INFO:root:running dependency-v2/albert-quantized using device /device:CPU:0\n"
]
}
],
"source": [
"quantized_model = malaya.dependency.transformer(model = 'albert', quantized = True)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Predict\n",
"\n",
"```python\n",
"def predict(self, string: str):\n",
" \"\"\"\n",
" Tag a string.\n",
"\n",
" Parameters\n",
" ----------\n",
" string: str\n",
"\n",
" Returns\n",
" -------\n",
" result: Tuple\n",
" \"\"\"\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [],
"source": [
"string = 'Dr Mahathir menasihati mereka supaya berhenti berehat dan tidur sebentar sekiranya mengantuk ketika memandu.'"
]
},
{
"cell_type": "code",
"execution_count": 7,
"metadata": {},
"outputs": [
{
"data": {
"image/svg+xml": [
"\n",
"\n",
"\n",
"\n",
"\n",
"\n",
"G \n",
" \n",
"\n",
"\n",
"0 \n",
"0 (None) \n",
" \n",
"\n",
"\n",
"3 \n",
"3 (menasihati) \n",
" \n",
"\n",
"\n",
"0->3 \n",
" \n",
" \n",
"root \n",
" \n",
"\n",
"\n",
"1 \n",
"1 (Dr) \n",
" \n",
"\n",
"\n",
"3->1 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"4 \n",
"4 (mereka) \n",
" \n",
"\n",
"\n",
"3->4 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"6 \n",
"6 (berhenti) \n",
" \n",
"\n",
"\n",
"3->6 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"15 \n",
"15 (.) \n",
" \n",
"\n",
"\n",
"3->15 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"2 \n",
"2 (Mahathir) \n",
" \n",
"\n",
"\n",
"1->2 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"5 \n",
"5 (supaya) \n",
" \n",
"\n",
"\n",
"6->5 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"7 \n",
"7 (berehat) \n",
" \n",
"\n",
"\n",
"6->7 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"9 \n",
"9 (tidur) \n",
" \n",
"\n",
"\n",
"6->9 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"8 \n",
"8 (dan) \n",
" \n",
"\n",
"\n",
"9->8 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"12 \n",
"12 (mengantuk) \n",
" \n",
"\n",
"\n",
"9->12 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"14 \n",
"14 (memandu) \n",
" \n",
"\n",
"\n",
"9->14 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"10 \n",
"10 (sebentar) \n",
" \n",
"\n",
"\n",
"12->10 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"11 \n",
"11 (sekiranya) \n",
" \n",
"\n",
"\n",
"12->11 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"13 \n",
"13 (ketika) \n",
" \n",
"\n",
"\n",
"14->13 \n",
" \n",
" \n",
"mark \n",
" \n",
" \n",
" \n"
],
"text/plain": [
""
]
},
"execution_count": 7,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"d_object, tagging, indexing = model.predict(string)\n",
"d_object.to_graphvis()"
]
},
{
"cell_type": "code",
"execution_count": 8,
"metadata": {},
"outputs": [
{
"data": {
"image/svg+xml": [
"\n",
"\n",
"\n",
"\n",
"\n",
"\n",
"G \n",
" \n",
"\n",
"\n",
"0 \n",
"0 (None) \n",
" \n",
"\n",
"\n",
"3 \n",
"3 (menasihati) \n",
" \n",
"\n",
"\n",
"0->3 \n",
" \n",
" \n",
"root \n",
" \n",
"\n",
"\n",
"1 \n",
"1 (Dr) \n",
" \n",
"\n",
"\n",
"3->1 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"4 \n",
"4 (mereka) \n",
" \n",
"\n",
"\n",
"3->4 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"6 \n",
"6 (berhenti) \n",
" \n",
"\n",
"\n",
"3->6 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"15 \n",
"15 (.) \n",
" \n",
"\n",
"\n",
"3->15 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"2 \n",
"2 (Mahathir) \n",
" \n",
"\n",
"\n",
"1->2 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"5 \n",
"5 (supaya) \n",
" \n",
"\n",
"\n",
"6->5 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"7 \n",
"7 (berehat) \n",
" \n",
"\n",
"\n",
"6->7 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"9 \n",
"9 (tidur) \n",
" \n",
"\n",
"\n",
"6->9 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"8 \n",
"8 (dan) \n",
" \n",
"\n",
"\n",
"9->8 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"12 \n",
"12 (mengantuk) \n",
" \n",
"\n",
"\n",
"9->12 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"14 \n",
"14 (memandu) \n",
" \n",
"\n",
"\n",
"9->14 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"10 \n",
"10 (sebentar) \n",
" \n",
"\n",
"\n",
"12->10 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"11 \n",
"11 (sekiranya) \n",
" \n",
"\n",
"\n",
"12->11 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"13 \n",
"13 (ketika) \n",
" \n",
"\n",
"\n",
"14->13 \n",
" \n",
" \n",
"mark \n",
" \n",
" \n",
" \n"
],
"text/plain": [
""
]
},
"execution_count": 8,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"d_object, tagging, indexing = quantized_model.predict(string)\n",
"d_object.to_graphvis()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Voting stack model"
]
},
{
"cell_type": "code",
"execution_count": 10,
"metadata": {},
"outputs": [
{
"name": "stderr",
"output_type": "stream",
"text": [
"INFO:root:running dependency-v2/alxlnet using device /device:CPU:0\n"
]
},
{
"data": {
"image/svg+xml": [
"\n",
"\n",
"\n",
"\n",
"\n",
"\n",
"G \n",
" \n",
"\n",
"\n",
"0 \n",
"0 (None) \n",
" \n",
"\n",
"\n",
"3 \n",
"3 (menasihati) \n",
" \n",
"\n",
"\n",
"0->3 \n",
" \n",
" \n",
"root \n",
" \n",
"\n",
"\n",
"1 \n",
"1 (Dr) \n",
" \n",
"\n",
"\n",
"3->1 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"4 \n",
"4 (mereka) \n",
" \n",
"\n",
"\n",
"3->4 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"6 \n",
"6 (berhenti) \n",
" \n",
"\n",
"\n",
"3->6 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"15 \n",
"15 (.) \n",
" \n",
"\n",
"\n",
"3->15 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"2 \n",
"2 (Mahathir) \n",
" \n",
"\n",
"\n",
"1->2 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"5 \n",
"5 (supaya) \n",
" \n",
"\n",
"\n",
"6->5 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"7 \n",
"7 (berehat) \n",
" \n",
"\n",
"\n",
"6->7 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"9 \n",
"9 (tidur) \n",
" \n",
"\n",
"\n",
"6->9 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"8 \n",
"8 (dan) \n",
" \n",
"\n",
"\n",
"9->8 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"12 \n",
"12 (mengantuk) \n",
" \n",
"\n",
"\n",
"9->12 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"14 \n",
"14 (memandu) \n",
" \n",
"\n",
"\n",
"9->14 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"10 \n",
"10 (sebentar) \n",
" \n",
"\n",
"\n",
"12->10 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"11 \n",
"11 (sekiranya) \n",
" \n",
"\n",
"\n",
"12->11 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"13 \n",
"13 (ketika) \n",
" \n",
"\n",
"\n",
"14->13 \n",
" \n",
" \n",
"mark \n",
" \n",
" \n",
" \n"
],
"text/plain": [
""
]
},
"execution_count": 10,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"alxlnet = malaya.dependency.transformer(model = 'alxlnet')\n",
"tagging, indexing = malaya.stack.voting_stack([model, model, alxlnet], string)\n",
"malaya.dependency.dependency_graph(tagging, indexing).to_graphvis()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Harder example"
]
},
{
"cell_type": "code",
"execution_count": 13,
"metadata": {},
"outputs": [],
"source": [
"# https://www.astroawani.com/berita-malaysia/terbaik-tun-kita-geng-najib-razak-puji-tun-m-297884\n",
"\n",
"s = \"\"\"\n",
"KUALA LUMPUR: Dalam hal politik, jarang sekali untuk melihat dua figura ini - bekas Perdana Menteri, Datuk Seri Najib Razak dan Tun Dr Mahathir Mohamad mempunyai 'pandangan yang sama' atau sekapal. Namun, situasi itu berbeza apabila melibatkan isu ketidakpatuhan terhadap prosedur operasi standard (SOP). Najib, yang juga Ahli Parlimen Pekan memuji sikap Ahli Parlimen Langkawi itu yang mengaku bersalah selepas melanggar SOP kerana tidak mengambil suhu badan ketika masuk ke sebuah surau di Langkawi pada Sabtu lalu.\n",
"\"\"\""
]
},
{
"cell_type": "code",
"execution_count": 14,
"metadata": {},
"outputs": [
{
"data": {
"image/svg+xml": [
"\n",
"\n",
"\n",
"\n",
"\n",
"\n",
"G \n",
" \n",
"\n",
"\n",
"0 \n",
"0 (None) \n",
" \n",
"\n",
"\n",
"11 \n",
"11 (melihat) \n",
" \n",
"\n",
"\n",
"0->11 \n",
" \n",
" \n",
"root \n",
" \n",
"\n",
"\n",
"1 \n",
"1 (KUALA) \n",
" \n",
"\n",
"\n",
"11->1 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"8 \n",
"8 (jarang) \n",
" \n",
"\n",
"\n",
"11->8 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"9 \n",
"9 (sekali) \n",
" \n",
"\n",
"\n",
"11->9 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"10 \n",
"10 (untuk) \n",
" \n",
"\n",
"\n",
"11->10 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"29 \n",
"29 (mempunyai) \n",
" \n",
"\n",
"\n",
"11->29 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"42 \n",
"42 (berbeza) \n",
" \n",
"\n",
"\n",
"11->42 \n",
" \n",
" \n",
"dep \n",
" \n",
"\n",
"\n",
"2 \n",
"2 (LUMPUR) \n",
" \n",
"\n",
"\n",
"1->2 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"5 \n",
"5 (hal) \n",
" \n",
"\n",
"\n",
"1->5 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"7 \n",
"7 (,) \n",
" \n",
"\n",
"\n",
"1->7 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"3 \n",
"3 (:) \n",
" \n",
"\n",
"\n",
"5->3 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"4 \n",
"4 (Dalam) \n",
" \n",
"\n",
"\n",
"5->4 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"6 \n",
"6 (politik) \n",
" \n",
"\n",
"\n",
"5->6 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"13 \n",
"13 (figura) \n",
" \n",
"\n",
"\n",
"29->13 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"31 \n",
"31 (pandangan) \n",
" \n",
"\n",
"\n",
"29->31 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"37 \n",
"37 (.) \n",
" \n",
"\n",
"\n",
"29->37 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"38 \n",
"38 (Namun) \n",
" \n",
"\n",
"\n",
"29->38 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"39 \n",
"39 (,) \n",
" \n",
"\n",
"\n",
"42->39 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"40 \n",
"40 (situasi) \n",
" \n",
"\n",
"\n",
"42->40 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"54 \n",
"54 (.) \n",
" \n",
"\n",
"\n",
"42->54 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"89 \n",
"89 (.) \n",
" \n",
"\n",
"\n",
"42->89 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"44 \n",
"44 (melibatkan) \n",
" \n",
"\n",
"\n",
"42->44 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"55 \n",
"55 (Najib) \n",
" \n",
"\n",
"\n",
"42->55 \n",
" \n",
" \n",
"dep \n",
" \n",
"\n",
"\n",
"12 \n",
"12 (dua) \n",
" \n",
"\n",
"\n",
"13->12 \n",
" \n",
" \n",
"nummod \n",
" \n",
"\n",
"\n",
"15 \n",
"15 (-) \n",
" \n",
"\n",
"\n",
"13->15 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"16 \n",
"16 (bekas) \n",
" \n",
"\n",
"\n",
"13->16 \n",
" \n",
" \n",
"compound:plur \n",
" \n",
"\n",
"\n",
"17 \n",
"17 (Perdana) \n",
" \n",
"\n",
"\n",
"13->17 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"14 \n",
"14 (ini) \n",
" \n",
"\n",
"\n",
"17->14 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"18 \n",
"18 (Menteri) \n",
" \n",
"\n",
"\n",
"17->18 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"19 \n",
"19 (,) \n",
" \n",
"\n",
"\n",
"17->19 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"20 \n",
"20 (Datuk) \n",
" \n",
"\n",
"\n",
"17->20 \n",
" \n",
" \n",
"appos \n",
" \n",
"\n",
"\n",
"25 \n",
"25 (Tun) \n",
" \n",
"\n",
"\n",
"17->25 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"21 \n",
"21 (Seri) \n",
" \n",
"\n",
"\n",
"20->21 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"24 \n",
"24 (dan) \n",
" \n",
"\n",
"\n",
"25->24 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"26 \n",
"26 (Dr) \n",
" \n",
"\n",
"\n",
"25->26 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"22 \n",
"22 (Najib) \n",
" \n",
"\n",
"\n",
"21->22 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"23 \n",
"23 (Razak) \n",
" \n",
"\n",
"\n",
"22->23 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"27 \n",
"27 (Mahathir) \n",
" \n",
"\n",
"\n",
"26->27 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"28 \n",
"28 (Mohamad) \n",
" \n",
"\n",
"\n",
"27->28 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"30 \n",
"30 (') \n",
" \n",
"\n",
"\n",
"31->30 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"33 \n",
"33 (sama) \n",
" \n",
"\n",
"\n",
"31->33 \n",
" \n",
" \n",
"amod \n",
" \n",
"\n",
"\n",
"36 \n",
"36 (sekapal) \n",
" \n",
"\n",
"\n",
"33->36 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"32 \n",
"32 (yang) \n",
" \n",
"\n",
"\n",
"36->32 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"34 \n",
"34 (') \n",
" \n",
"\n",
"\n",
"36->34 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"35 \n",
"35 (atau) \n",
" \n",
"\n",
"\n",
"36->35 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"41 \n",
"41 (itu) \n",
" \n",
"\n",
"\n",
"40->41 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"43 \n",
"43 (apabila) \n",
" \n",
"\n",
"\n",
"44->43 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"45 \n",
"45 (isu) \n",
" \n",
"\n",
"\n",
"44->45 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"56 \n",
"56 (,) \n",
" \n",
"\n",
"\n",
"55->56 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"59 \n",
"59 (Ahli) \n",
" \n",
"\n",
"\n",
"55->59 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"62 \n",
"62 (memuji) \n",
" \n",
"\n",
"\n",
"55->62 \n",
" \n",
" \n",
"acl \n",
" \n",
"\n",
"\n",
"46 \n",
"46 (ketidakpatuhan) \n",
" \n",
"\n",
"\n",
"45->46 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"48 \n",
"48 (prosedur) \n",
" \n",
"\n",
"\n",
"45->48 \n",
" \n",
" \n",
"nmod \n",
" \n",
"\n",
"\n",
"47 \n",
"47 (terhadap) \n",
" \n",
"\n",
"\n",
"48->47 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"49 \n",
"49 (operasi) \n",
" \n",
"\n",
"\n",
"48->49 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"50 \n",
"50 (standard) \n",
" \n",
"\n",
"\n",
"48->50 \n",
" \n",
" \n",
"amod \n",
" \n",
"\n",
"\n",
"52 \n",
"52 (SOP) \n",
" \n",
"\n",
"\n",
"48->52 \n",
" \n",
" \n",
"appos \n",
" \n",
"\n",
"\n",
"51 \n",
"51 (() \n",
" \n",
"\n",
"\n",
"52->51 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"53 \n",
"53 ()) \n",
" \n",
"\n",
"\n",
"52->53 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"57 \n",
"57 (yang) \n",
" \n",
"\n",
"\n",
"59->57 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"58 \n",
"58 (juga) \n",
" \n",
"\n",
"\n",
"59->58 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"60 \n",
"60 (Parlimen) \n",
" \n",
"\n",
"\n",
"59->60 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"63 \n",
"63 (sikap) \n",
" \n",
"\n",
"\n",
"62->63 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"61 \n",
"61 (Pekan) \n",
" \n",
"\n",
"\n",
"60->61 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"64 \n",
"64 (Ahli) \n",
" \n",
"\n",
"\n",
"63->64 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"69 \n",
"69 (mengaku) \n",
" \n",
"\n",
"\n",
"63->69 \n",
" \n",
" \n",
"acl \n",
" \n",
"\n",
"\n",
"65 \n",
"65 (Parlimen) \n",
" \n",
"\n",
"\n",
"64->65 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"68 \n",
"68 (yang) \n",
" \n",
"\n",
"\n",
"69->68 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"70 \n",
"70 (bersalah) \n",
" \n",
"\n",
"\n",
"69->70 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"66 \n",
"66 (Langkawi) \n",
" \n",
"\n",
"\n",
"65->66 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"67 \n",
"67 (itu) \n",
" \n",
"\n",
"\n",
"66->67 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"72 \n",
"72 (melanggar) \n",
" \n",
"\n",
"\n",
"70->72 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"71 \n",
"71 (selepas) \n",
" \n",
"\n",
"\n",
"72->71 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"73 \n",
"73 (SOP) \n",
" \n",
"\n",
"\n",
"72->73 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"76 \n",
"76 (mengambil) \n",
" \n",
"\n",
"\n",
"72->76 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"74 \n",
"74 (kerana) \n",
" \n",
"\n",
"\n",
"76->74 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"75 \n",
"75 (tidak) \n",
" \n",
"\n",
"\n",
"76->75 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"77 \n",
"77 (suhu) \n",
" \n",
"\n",
"\n",
"76->77 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"80 \n",
"80 (masuk) \n",
" \n",
"\n",
"\n",
"76->80 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"78 \n",
"78 (badan) \n",
" \n",
"\n",
"\n",
"77->78 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"79 \n",
"79 (ketika) \n",
" \n",
"\n",
"\n",
"80->79 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"83 \n",
"83 (surau) \n",
" \n",
"\n",
"\n",
"80->83 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"85 \n",
"85 (Langkawi) \n",
" \n",
"\n",
"\n",
"80->85 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"87 \n",
"87 (Sabtu) \n",
" \n",
"\n",
"\n",
"80->87 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"81 \n",
"81 (ke) \n",
" \n",
"\n",
"\n",
"83->81 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"82 \n",
"82 (sebuah) \n",
" \n",
"\n",
"\n",
"83->82 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"84 \n",
"84 (di) \n",
" \n",
"\n",
"\n",
"85->84 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"86 \n",
"86 (pada) \n",
" \n",
"\n",
"\n",
"87->86 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"88 \n",
"88 (lalu) \n",
" \n",
"\n",
"\n",
"87->88 \n",
" \n",
" \n",
"amod \n",
" \n",
" \n",
" \n"
],
"text/plain": [
""
]
},
"execution_count": 14,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"d_object, tagging, indexing = model.predict(s)\n",
"d_object.to_graphvis()"
]
},
{
"cell_type": "code",
"execution_count": 15,
"metadata": {},
"outputs": [
{
"data": {
"image/svg+xml": [
"\n",
"\n",
"\n",
"\n",
"\n",
"\n",
"G \n",
" \n",
"\n",
"\n",
"0 \n",
"0 (None) \n",
" \n",
"\n",
"\n",
"11 \n",
"11 (melihat) \n",
" \n",
"\n",
"\n",
"0->11 \n",
" \n",
" \n",
"root \n",
" \n",
"\n",
"\n",
"1 \n",
"1 (KUALA) \n",
" \n",
"\n",
"\n",
"11->1 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"8 \n",
"8 (jarang) \n",
" \n",
"\n",
"\n",
"11->8 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"9 \n",
"9 (sekali) \n",
" \n",
"\n",
"\n",
"11->9 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"10 \n",
"10 (untuk) \n",
" \n",
"\n",
"\n",
"11->10 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"29 \n",
"29 (mempunyai) \n",
" \n",
"\n",
"\n",
"11->29 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"42 \n",
"42 (berbeza) \n",
" \n",
"\n",
"\n",
"11->42 \n",
" \n",
" \n",
"dep \n",
" \n",
"\n",
"\n",
"2 \n",
"2 (LUMPUR) \n",
" \n",
"\n",
"\n",
"1->2 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"5 \n",
"5 (hal) \n",
" \n",
"\n",
"\n",
"1->5 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"7 \n",
"7 (,) \n",
" \n",
"\n",
"\n",
"1->7 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"3 \n",
"3 (:) \n",
" \n",
"\n",
"\n",
"5->3 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"4 \n",
"4 (Dalam) \n",
" \n",
"\n",
"\n",
"5->4 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"6 \n",
"6 (politik) \n",
" \n",
"\n",
"\n",
"5->6 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"13 \n",
"13 (figura) \n",
" \n",
"\n",
"\n",
"29->13 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"31 \n",
"31 (pandangan) \n",
" \n",
"\n",
"\n",
"29->31 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"37 \n",
"37 (.) \n",
" \n",
"\n",
"\n",
"29->37 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"38 \n",
"38 (Namun) \n",
" \n",
"\n",
"\n",
"29->38 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"39 \n",
"39 (,) \n",
" \n",
"\n",
"\n",
"42->39 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"40 \n",
"40 (situasi) \n",
" \n",
"\n",
"\n",
"42->40 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"54 \n",
"54 (.) \n",
" \n",
"\n",
"\n",
"42->54 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"89 \n",
"89 (.) \n",
" \n",
"\n",
"\n",
"42->89 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"44 \n",
"44 (melibatkan) \n",
" \n",
"\n",
"\n",
"42->44 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"55 \n",
"55 (Najib) \n",
" \n",
"\n",
"\n",
"42->55 \n",
" \n",
" \n",
"dep \n",
" \n",
"\n",
"\n",
"12 \n",
"12 (dua) \n",
" \n",
"\n",
"\n",
"13->12 \n",
" \n",
" \n",
"nummod \n",
" \n",
"\n",
"\n",
"15 \n",
"15 (-) \n",
" \n",
"\n",
"\n",
"13->15 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"16 \n",
"16 (bekas) \n",
" \n",
"\n",
"\n",
"13->16 \n",
" \n",
" \n",
"compound:plur \n",
" \n",
"\n",
"\n",
"17 \n",
"17 (Perdana) \n",
" \n",
"\n",
"\n",
"13->17 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"14 \n",
"14 (ini) \n",
" \n",
"\n",
"\n",
"17->14 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"18 \n",
"18 (Menteri) \n",
" \n",
"\n",
"\n",
"17->18 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"19 \n",
"19 (,) \n",
" \n",
"\n",
"\n",
"17->19 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"20 \n",
"20 (Datuk) \n",
" \n",
"\n",
"\n",
"17->20 \n",
" \n",
" \n",
"appos \n",
" \n",
"\n",
"\n",
"25 \n",
"25 (Tun) \n",
" \n",
"\n",
"\n",
"17->25 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"21 \n",
"21 (Seri) \n",
" \n",
"\n",
"\n",
"20->21 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"24 \n",
"24 (dan) \n",
" \n",
"\n",
"\n",
"25->24 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"26 \n",
"26 (Dr) \n",
" \n",
"\n",
"\n",
"25->26 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"22 \n",
"22 (Najib) \n",
" \n",
"\n",
"\n",
"21->22 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"23 \n",
"23 (Razak) \n",
" \n",
"\n",
"\n",
"22->23 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"27 \n",
"27 (Mahathir) \n",
" \n",
"\n",
"\n",
"26->27 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"28 \n",
"28 (Mohamad) \n",
" \n",
"\n",
"\n",
"27->28 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"30 \n",
"30 (') \n",
" \n",
"\n",
"\n",
"31->30 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"33 \n",
"33 (sama) \n",
" \n",
"\n",
"\n",
"31->33 \n",
" \n",
" \n",
"amod \n",
" \n",
"\n",
"\n",
"36 \n",
"36 (sekapal) \n",
" \n",
"\n",
"\n",
"33->36 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"32 \n",
"32 (yang) \n",
" \n",
"\n",
"\n",
"36->32 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"34 \n",
"34 (') \n",
" \n",
"\n",
"\n",
"36->34 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"35 \n",
"35 (atau) \n",
" \n",
"\n",
"\n",
"36->35 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"41 \n",
"41 (itu) \n",
" \n",
"\n",
"\n",
"40->41 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"43 \n",
"43 (apabila) \n",
" \n",
"\n",
"\n",
"44->43 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"45 \n",
"45 (isu) \n",
" \n",
"\n",
"\n",
"44->45 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"56 \n",
"56 (,) \n",
" \n",
"\n",
"\n",
"55->56 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"59 \n",
"59 (Ahli) \n",
" \n",
"\n",
"\n",
"55->59 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"62 \n",
"62 (memuji) \n",
" \n",
"\n",
"\n",
"55->62 \n",
" \n",
" \n",
"acl \n",
" \n",
"\n",
"\n",
"46 \n",
"46 (ketidakpatuhan) \n",
" \n",
"\n",
"\n",
"45->46 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"48 \n",
"48 (prosedur) \n",
" \n",
"\n",
"\n",
"45->48 \n",
" \n",
" \n",
"nmod \n",
" \n",
"\n",
"\n",
"47 \n",
"47 (terhadap) \n",
" \n",
"\n",
"\n",
"48->47 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"49 \n",
"49 (operasi) \n",
" \n",
"\n",
"\n",
"48->49 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"50 \n",
"50 (standard) \n",
" \n",
"\n",
"\n",
"48->50 \n",
" \n",
" \n",
"amod \n",
" \n",
"\n",
"\n",
"52 \n",
"52 (SOP) \n",
" \n",
"\n",
"\n",
"48->52 \n",
" \n",
" \n",
"appos \n",
" \n",
"\n",
"\n",
"51 \n",
"51 (() \n",
" \n",
"\n",
"\n",
"52->51 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"53 \n",
"53 ()) \n",
" \n",
"\n",
"\n",
"52->53 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"57 \n",
"57 (yang) \n",
" \n",
"\n",
"\n",
"59->57 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"58 \n",
"58 (juga) \n",
" \n",
"\n",
"\n",
"59->58 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"60 \n",
"60 (Parlimen) \n",
" \n",
"\n",
"\n",
"59->60 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"63 \n",
"63 (sikap) \n",
" \n",
"\n",
"\n",
"62->63 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"61 \n",
"61 (Pekan) \n",
" \n",
"\n",
"\n",
"60->61 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"64 \n",
"64 (Ahli) \n",
" \n",
"\n",
"\n",
"63->64 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"69 \n",
"69 (mengaku) \n",
" \n",
"\n",
"\n",
"63->69 \n",
" \n",
" \n",
"acl \n",
" \n",
"\n",
"\n",
"65 \n",
"65 (Parlimen) \n",
" \n",
"\n",
"\n",
"64->65 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"68 \n",
"68 (yang) \n",
" \n",
"\n",
"\n",
"69->68 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"70 \n",
"70 (bersalah) \n",
" \n",
"\n",
"\n",
"69->70 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"66 \n",
"66 (Langkawi) \n",
" \n",
"\n",
"\n",
"65->66 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"67 \n",
"67 (itu) \n",
" \n",
"\n",
"\n",
"66->67 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"72 \n",
"72 (melanggar) \n",
" \n",
"\n",
"\n",
"70->72 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"71 \n",
"71 (selepas) \n",
" \n",
"\n",
"\n",
"72->71 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"73 \n",
"73 (SOP) \n",
" \n",
"\n",
"\n",
"72->73 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"76 \n",
"76 (mengambil) \n",
" \n",
"\n",
"\n",
"72->76 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"74 \n",
"74 (kerana) \n",
" \n",
"\n",
"\n",
"76->74 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"75 \n",
"75 (tidak) \n",
" \n",
"\n",
"\n",
"76->75 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"77 \n",
"77 (suhu) \n",
" \n",
"\n",
"\n",
"76->77 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"80 \n",
"80 (masuk) \n",
" \n",
"\n",
"\n",
"76->80 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"78 \n",
"78 (badan) \n",
" \n",
"\n",
"\n",
"77->78 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"79 \n",
"79 (ketika) \n",
" \n",
"\n",
"\n",
"80->79 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"83 \n",
"83 (surau) \n",
" \n",
"\n",
"\n",
"80->83 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"85 \n",
"85 (Langkawi) \n",
" \n",
"\n",
"\n",
"80->85 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"87 \n",
"87 (Sabtu) \n",
" \n",
"\n",
"\n",
"80->87 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"81 \n",
"81 (ke) \n",
" \n",
"\n",
"\n",
"83->81 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"82 \n",
"82 (sebuah) \n",
" \n",
"\n",
"\n",
"83->82 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"84 \n",
"84 (di) \n",
" \n",
"\n",
"\n",
"85->84 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"86 \n",
"86 (pada) \n",
" \n",
"\n",
"\n",
"87->86 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"88 \n",
"88 (lalu) \n",
" \n",
"\n",
"\n",
"87->88 \n",
" \n",
" \n",
"amod \n",
" \n",
" \n",
" \n"
],
"text/plain": [
""
]
},
"execution_count": 15,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"tagging, indexing = malaya.stack.voting_stack([model, model, alxlnet], s)\n",
"malaya.dependency.dependency_graph(tagging, indexing).to_graphvis()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Dependency graph object\n",
"\n",
"To initiate a dependency graph from dependency models, you need to call `malaya.dependency.dependency_graph`."
]
},
{
"cell_type": "code",
"execution_count": 16,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
""
]
},
"execution_count": 16,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"graph = malaya.dependency.dependency_graph(tagging, indexing)\n",
"graph"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#### generate graphvis"
]
},
{
"cell_type": "code",
"execution_count": 17,
"metadata": {
"scrolled": true
},
"outputs": [
{
"data": {
"image/svg+xml": [
"\n",
"\n",
"\n",
"\n",
"\n",
"\n",
"G \n",
" \n",
"\n",
"\n",
"0 \n",
"0 (None) \n",
" \n",
"\n",
"\n",
"11 \n",
"11 (melihat) \n",
" \n",
"\n",
"\n",
"0->11 \n",
" \n",
" \n",
"root \n",
" \n",
"\n",
"\n",
"1 \n",
"1 (KUALA) \n",
" \n",
"\n",
"\n",
"11->1 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"8 \n",
"8 (jarang) \n",
" \n",
"\n",
"\n",
"11->8 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"9 \n",
"9 (sekali) \n",
" \n",
"\n",
"\n",
"11->9 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"10 \n",
"10 (untuk) \n",
" \n",
"\n",
"\n",
"11->10 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"29 \n",
"29 (mempunyai) \n",
" \n",
"\n",
"\n",
"11->29 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"42 \n",
"42 (berbeza) \n",
" \n",
"\n",
"\n",
"11->42 \n",
" \n",
" \n",
"dep \n",
" \n",
"\n",
"\n",
"2 \n",
"2 (LUMPUR) \n",
" \n",
"\n",
"\n",
"1->2 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"5 \n",
"5 (hal) \n",
" \n",
"\n",
"\n",
"1->5 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"7 \n",
"7 (,) \n",
" \n",
"\n",
"\n",
"1->7 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"3 \n",
"3 (:) \n",
" \n",
"\n",
"\n",
"5->3 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"4 \n",
"4 (Dalam) \n",
" \n",
"\n",
"\n",
"5->4 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"6 \n",
"6 (politik) \n",
" \n",
"\n",
"\n",
"5->6 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"13 \n",
"13 (figura) \n",
" \n",
"\n",
"\n",
"29->13 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"31 \n",
"31 (pandangan) \n",
" \n",
"\n",
"\n",
"29->31 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"37 \n",
"37 (.) \n",
" \n",
"\n",
"\n",
"29->37 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"38 \n",
"38 (Namun) \n",
" \n",
"\n",
"\n",
"29->38 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"39 \n",
"39 (,) \n",
" \n",
"\n",
"\n",
"42->39 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"40 \n",
"40 (situasi) \n",
" \n",
"\n",
"\n",
"42->40 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"54 \n",
"54 (.) \n",
" \n",
"\n",
"\n",
"42->54 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"89 \n",
"89 (.) \n",
" \n",
"\n",
"\n",
"42->89 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"44 \n",
"44 (melibatkan) \n",
" \n",
"\n",
"\n",
"42->44 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"55 \n",
"55 (Najib) \n",
" \n",
"\n",
"\n",
"42->55 \n",
" \n",
" \n",
"dep \n",
" \n",
"\n",
"\n",
"12 \n",
"12 (dua) \n",
" \n",
"\n",
"\n",
"13->12 \n",
" \n",
" \n",
"nummod \n",
" \n",
"\n",
"\n",
"15 \n",
"15 (-) \n",
" \n",
"\n",
"\n",
"13->15 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"16 \n",
"16 (bekas) \n",
" \n",
"\n",
"\n",
"13->16 \n",
" \n",
" \n",
"compound:plur \n",
" \n",
"\n",
"\n",
"17 \n",
"17 (Perdana) \n",
" \n",
"\n",
"\n",
"13->17 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"14 \n",
"14 (ini) \n",
" \n",
"\n",
"\n",
"17->14 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"18 \n",
"18 (Menteri) \n",
" \n",
"\n",
"\n",
"17->18 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"19 \n",
"19 (,) \n",
" \n",
"\n",
"\n",
"17->19 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"20 \n",
"20 (Datuk) \n",
" \n",
"\n",
"\n",
"17->20 \n",
" \n",
" \n",
"appos \n",
" \n",
"\n",
"\n",
"25 \n",
"25 (Tun) \n",
" \n",
"\n",
"\n",
"17->25 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"21 \n",
"21 (Seri) \n",
" \n",
"\n",
"\n",
"20->21 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"24 \n",
"24 (dan) \n",
" \n",
"\n",
"\n",
"25->24 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"26 \n",
"26 (Dr) \n",
" \n",
"\n",
"\n",
"25->26 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"22 \n",
"22 (Najib) \n",
" \n",
"\n",
"\n",
"21->22 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"23 \n",
"23 (Razak) \n",
" \n",
"\n",
"\n",
"22->23 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"27 \n",
"27 (Mahathir) \n",
" \n",
"\n",
"\n",
"26->27 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"28 \n",
"28 (Mohamad) \n",
" \n",
"\n",
"\n",
"27->28 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"30 \n",
"30 (') \n",
" \n",
"\n",
"\n",
"31->30 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"33 \n",
"33 (sama) \n",
" \n",
"\n",
"\n",
"31->33 \n",
" \n",
" \n",
"amod \n",
" \n",
"\n",
"\n",
"36 \n",
"36 (sekapal) \n",
" \n",
"\n",
"\n",
"33->36 \n",
" \n",
" \n",
"conj \n",
" \n",
"\n",
"\n",
"32 \n",
"32 (yang) \n",
" \n",
"\n",
"\n",
"36->32 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"34 \n",
"34 (') \n",
" \n",
"\n",
"\n",
"36->34 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"35 \n",
"35 (atau) \n",
" \n",
"\n",
"\n",
"36->35 \n",
" \n",
" \n",
"cc \n",
" \n",
"\n",
"\n",
"41 \n",
"41 (itu) \n",
" \n",
"\n",
"\n",
"40->41 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"43 \n",
"43 (apabila) \n",
" \n",
"\n",
"\n",
"44->43 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"45 \n",
"45 (isu) \n",
" \n",
"\n",
"\n",
"44->45 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"56 \n",
"56 (,) \n",
" \n",
"\n",
"\n",
"55->56 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"59 \n",
"59 (Ahli) \n",
" \n",
"\n",
"\n",
"55->59 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"62 \n",
"62 (memuji) \n",
" \n",
"\n",
"\n",
"55->62 \n",
" \n",
" \n",
"acl \n",
" \n",
"\n",
"\n",
"46 \n",
"46 (ketidakpatuhan) \n",
" \n",
"\n",
"\n",
"45->46 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"48 \n",
"48 (prosedur) \n",
" \n",
"\n",
"\n",
"45->48 \n",
" \n",
" \n",
"nmod \n",
" \n",
"\n",
"\n",
"47 \n",
"47 (terhadap) \n",
" \n",
"\n",
"\n",
"48->47 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"49 \n",
"49 (operasi) \n",
" \n",
"\n",
"\n",
"48->49 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"50 \n",
"50 (standard) \n",
" \n",
"\n",
"\n",
"48->50 \n",
" \n",
" \n",
"amod \n",
" \n",
"\n",
"\n",
"52 \n",
"52 (SOP) \n",
" \n",
"\n",
"\n",
"48->52 \n",
" \n",
" \n",
"appos \n",
" \n",
"\n",
"\n",
"51 \n",
"51 (() \n",
" \n",
"\n",
"\n",
"52->51 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"53 \n",
"53 ()) \n",
" \n",
"\n",
"\n",
"52->53 \n",
" \n",
" \n",
"punct \n",
" \n",
"\n",
"\n",
"57 \n",
"57 (yang) \n",
" \n",
"\n",
"\n",
"59->57 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"58 \n",
"58 (juga) \n",
" \n",
"\n",
"\n",
"59->58 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"60 \n",
"60 (Parlimen) \n",
" \n",
"\n",
"\n",
"59->60 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"63 \n",
"63 (sikap) \n",
" \n",
"\n",
"\n",
"62->63 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"61 \n",
"61 (Pekan) \n",
" \n",
"\n",
"\n",
"60->61 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"64 \n",
"64 (Ahli) \n",
" \n",
"\n",
"\n",
"63->64 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"69 \n",
"69 (mengaku) \n",
" \n",
"\n",
"\n",
"63->69 \n",
" \n",
" \n",
"acl \n",
" \n",
"\n",
"\n",
"65 \n",
"65 (Parlimen) \n",
" \n",
"\n",
"\n",
"64->65 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"68 \n",
"68 (yang) \n",
" \n",
"\n",
"\n",
"69->68 \n",
" \n",
" \n",
"nsubj \n",
" \n",
"\n",
"\n",
"70 \n",
"70 (bersalah) \n",
" \n",
"\n",
"\n",
"69->70 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"66 \n",
"66 (Langkawi) \n",
" \n",
"\n",
"\n",
"65->66 \n",
" \n",
" \n",
"flat \n",
" \n",
"\n",
"\n",
"67 \n",
"67 (itu) \n",
" \n",
"\n",
"\n",
"66->67 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"72 \n",
"72 (melanggar) \n",
" \n",
"\n",
"\n",
"70->72 \n",
" \n",
" \n",
"xcomp \n",
" \n",
"\n",
"\n",
"71 \n",
"71 (selepas) \n",
" \n",
"\n",
"\n",
"72->71 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"73 \n",
"73 (SOP) \n",
" \n",
"\n",
"\n",
"72->73 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"76 \n",
"76 (mengambil) \n",
" \n",
"\n",
"\n",
"72->76 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"74 \n",
"74 (kerana) \n",
" \n",
"\n",
"\n",
"76->74 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"75 \n",
"75 (tidak) \n",
" \n",
"\n",
"\n",
"76->75 \n",
" \n",
" \n",
"advmod \n",
" \n",
"\n",
"\n",
"77 \n",
"77 (suhu) \n",
" \n",
"\n",
"\n",
"76->77 \n",
" \n",
" \n",
"obj \n",
" \n",
"\n",
"\n",
"80 \n",
"80 (masuk) \n",
" \n",
"\n",
"\n",
"76->80 \n",
" \n",
" \n",
"advcl \n",
" \n",
"\n",
"\n",
"78 \n",
"78 (badan) \n",
" \n",
"\n",
"\n",
"77->78 \n",
" \n",
" \n",
"compound \n",
" \n",
"\n",
"\n",
"79 \n",
"79 (ketika) \n",
" \n",
"\n",
"\n",
"80->79 \n",
" \n",
" \n",
"mark \n",
" \n",
"\n",
"\n",
"83 \n",
"83 (surau) \n",
" \n",
"\n",
"\n",
"80->83 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"85 \n",
"85 (Langkawi) \n",
" \n",
"\n",
"\n",
"80->85 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"87 \n",
"87 (Sabtu) \n",
" \n",
"\n",
"\n",
"80->87 \n",
" \n",
" \n",
"obl \n",
" \n",
"\n",
"\n",
"81 \n",
"81 (ke) \n",
" \n",
"\n",
"\n",
"83->81 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"82 \n",
"82 (sebuah) \n",
" \n",
"\n",
"\n",
"83->82 \n",
" \n",
" \n",
"det \n",
" \n",
"\n",
"\n",
"84 \n",
"84 (di) \n",
" \n",
"\n",
"\n",
"85->84 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"86 \n",
"86 (pada) \n",
" \n",
"\n",
"\n",
"87->86 \n",
" \n",
" \n",
"case \n",
" \n",
"\n",
"\n",
"88 \n",
"88 (lalu) \n",
" \n",
"\n",
"\n",
"87->88 \n",
" \n",
" \n",
"amod \n",
" \n",
" \n",
" \n"
],
"text/plain": [
""
]
},
"execution_count": 17,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"graph.to_graphvis()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#### Get nodes"
]
},
{
"cell_type": "code",
"execution_count": 17,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"defaultdict(.()>,\n",
" {0: {'address': 0,\n",
" 'word': None,\n",
" 'lemma': None,\n",
" 'ctag': 'TOP',\n",
" 'tag': 'TOP',\n",
" 'feats': None,\n",
" 'head': None,\n",
" 'deps': defaultdict(list, {'root': [11]}),\n",
" 'rel': None},\n",
" 1: {'address': 1,\n",
" 'word': 'KUALA',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 11,\n",
" 'deps': defaultdict(list,\n",
" {'flat': [2], 'obl': [5], 'punct': [7]}),\n",
" 'rel': 'nsubj'},\n",
" 11: {'address': 11,\n",
" 'word': 'melihat',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 0,\n",
" 'deps': defaultdict(list,\n",
" {'nsubj': [1],\n",
" 'advmod': [8, 9],\n",
" 'case': [10],\n",
" 'advcl': [29],\n",
" 'dep': [42]}),\n",
" 'rel': 'root'},\n",
" 2: {'address': 2,\n",
" 'word': 'LUMPUR',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 1,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'flat'},\n",
" 3: {'address': 3,\n",
" 'word': ':',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 5,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 5: {'address': 5,\n",
" 'word': 'hal',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 1,\n",
" 'deps': defaultdict(list,\n",
" {'punct': [3], 'case': [4], 'compound': [6]}),\n",
" 'rel': 'obl'},\n",
" 4: {'address': 4,\n",
" 'word': 'Dalam',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 5,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'case'},\n",
" 6: {'address': 6,\n",
" 'word': 'politik',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 5,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'compound'},\n",
" 7: {'address': 7,\n",
" 'word': ',',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 1,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 8: {'address': 8,\n",
" 'word': 'jarang',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 11,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'advmod'},\n",
" 9: {'address': 9,\n",
" 'word': 'sekali',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 11,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'advmod'},\n",
" 10: {'address': 10,\n",
" 'word': 'untuk',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 11,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'case'},\n",
" 12: {'address': 12,\n",
" 'word': 'dua',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 13,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'nummod'},\n",
" 13: {'address': 13,\n",
" 'word': 'figura',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 29,\n",
" 'deps': defaultdict(list,\n",
" {'nummod': [12],\n",
" 'punct': [15],\n",
" 'compound:plur': [16],\n",
" 'flat': [17]}),\n",
" 'rel': 'obj'},\n",
" 29: {'address': 29,\n",
" 'word': 'mempunyai',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 11,\n",
" 'deps': defaultdict(list,\n",
" {'obj': [13, 31], 'punct': [37], 'mark': [38]}),\n",
" 'rel': 'advcl'},\n",
" 14: {'address': 14,\n",
" 'word': 'ini',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 17,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'det'},\n",
" 17: {'address': 17,\n",
" 'word': 'Perdana',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 13,\n",
" 'deps': defaultdict(list,\n",
" {'det': [14],\n",
" 'flat': [18],\n",
" 'punct': [19],\n",
" 'appos': [20],\n",
" 'conj': [25]}),\n",
" 'rel': 'flat'},\n",
" 15: {'address': 15,\n",
" 'word': '-',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 13,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 16: {'address': 16,\n",
" 'word': 'bekas',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 13,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'compound:plur'},\n",
" 18: {'address': 18,\n",
" 'word': 'Menteri',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 17,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'flat'},\n",
" 19: {'address': 19,\n",
" 'word': ',',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 17,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 20: {'address': 20,\n",
" 'word': 'Datuk',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 17,\n",
" 'deps': defaultdict(list, {'flat': [21]}),\n",
" 'rel': 'appos'},\n",
" 21: {'address': 21,\n",
" 'word': 'Seri',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 20,\n",
" 'deps': defaultdict(list, {'flat': [22]}),\n",
" 'rel': 'flat'},\n",
" 22: {'address': 22,\n",
" 'word': 'Najib',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 21,\n",
" 'deps': defaultdict(list, {'flat': [23]}),\n",
" 'rel': 'flat'},\n",
" 23: {'address': 23,\n",
" 'word': 'Razak',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 22,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'flat'},\n",
" 24: {'address': 24,\n",
" 'word': 'dan',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 25,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'cc'},\n",
" 25: {'address': 25,\n",
" 'word': 'Tun',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 17,\n",
" 'deps': defaultdict(list, {'cc': [24], 'flat': [26]}),\n",
" 'rel': 'conj'},\n",
" 26: {'address': 26,\n",
" 'word': 'Dr',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 25,\n",
" 'deps': defaultdict(list, {'flat': [27]}),\n",
" 'rel': 'flat'},\n",
" 27: {'address': 27,\n",
" 'word': 'Mahathir',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 26,\n",
" 'deps': defaultdict(list, {'flat': [28]}),\n",
" 'rel': 'flat'},\n",
" 28: {'address': 28,\n",
" 'word': 'Mohamad',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 27,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'flat'},\n",
" 30: {'address': 30,\n",
" 'word': \"'\",\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 31,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 31: {'address': 31,\n",
" 'word': 'pandangan',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 29,\n",
" 'deps': defaultdict(list, {'punct': [30], 'amod': [33]}),\n",
" 'rel': 'obj'},\n",
" 32: {'address': 32,\n",
" 'word': 'yang',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 36,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'nsubj'},\n",
" 36: {'address': 36,\n",
" 'word': 'sekapal',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 33,\n",
" 'deps': defaultdict(list,\n",
" {'nsubj': [32], 'punct': [34], 'cc': [35]}),\n",
" 'rel': 'conj'},\n",
" 33: {'address': 33,\n",
" 'word': 'sama',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 31,\n",
" 'deps': defaultdict(list, {'conj': [36]}),\n",
" 'rel': 'amod'},\n",
" 34: {'address': 34,\n",
" 'word': \"'\",\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 36,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 35: {'address': 35,\n",
" 'word': 'atau',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 36,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'cc'},\n",
" 37: {'address': 37,\n",
" 'word': '.',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 29,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 38: {'address': 38,\n",
" 'word': 'Namun',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 29,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'mark'},\n",
" 39: {'address': 39,\n",
" 'word': ',',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 42,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 42: {'address': 42,\n",
" 'word': 'berbeza',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 11,\n",
" 'deps': defaultdict(list,\n",
" {'punct': [39, 54, 89],\n",
" 'nsubj': [40],\n",
" 'advcl': [44],\n",
" 'dep': [55]}),\n",
" 'rel': 'dep'},\n",
" 40: {'address': 40,\n",
" 'word': 'situasi',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 42,\n",
" 'deps': defaultdict(list, {'det': [41]}),\n",
" 'rel': 'nsubj'},\n",
" 41: {'address': 41,\n",
" 'word': 'itu',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 40,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'det'},\n",
" 43: {'address': 43,\n",
" 'word': 'apabila',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 44,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'mark'},\n",
" 44: {'address': 44,\n",
" 'word': 'melibatkan',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 42,\n",
" 'deps': defaultdict(list, {'mark': [43], 'obj': [45]}),\n",
" 'rel': 'advcl'},\n",
" 45: {'address': 45,\n",
" 'word': 'isu',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 44,\n",
" 'deps': defaultdict(list, {'compound': [46], 'nmod': [48]}),\n",
" 'rel': 'obj'},\n",
" 46: {'address': 46,\n",
" 'word': 'ketidakpatuhan',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 45,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'compound'},\n",
" 47: {'address': 47,\n",
" 'word': 'terhadap',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 48,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'case'},\n",
" 48: {'address': 48,\n",
" 'word': 'prosedur',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 45,\n",
" 'deps': defaultdict(list,\n",
" {'case': [47],\n",
" 'compound': [49],\n",
" 'amod': [50],\n",
" 'appos': [52]}),\n",
" 'rel': 'nmod'},\n",
" 49: {'address': 49,\n",
" 'word': 'operasi',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 48,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'compound'},\n",
" 50: {'address': 50,\n",
" 'word': 'standard',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 48,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'amod'},\n",
" 51: {'address': 51,\n",
" 'word': '(',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 52,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 52: {'address': 52,\n",
" 'word': 'SOP',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 48,\n",
" 'deps': defaultdict(list, {'punct': [51, 53]}),\n",
" 'rel': 'appos'},\n",
" 53: {'address': 53,\n",
" 'word': ')',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 52,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 54: {'address': 54,\n",
" 'word': '.',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 42,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 55: {'address': 55,\n",
" 'word': 'Najib',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 42,\n",
" 'deps': defaultdict(list,\n",
" {'punct': [56], 'nsubj': [59], 'acl': [62]}),\n",
" 'rel': 'dep'},\n",
" 56: {'address': 56,\n",
" 'word': ',',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 55,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'},\n",
" 57: {'address': 57,\n",
" 'word': 'yang',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 59,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'nsubj'},\n",
" 59: {'address': 59,\n",
" 'word': 'Ahli',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 55,\n",
" 'deps': defaultdict(list,\n",
" {'nsubj': [57], 'advmod': [58], 'flat': [60]}),\n",
" 'rel': 'nsubj'},\n",
" 58: {'address': 58,\n",
" 'word': 'juga',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 59,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'advmod'},\n",
" 60: {'address': 60,\n",
" 'word': 'Parlimen',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 59,\n",
" 'deps': defaultdict(list, {'flat': [61]}),\n",
" 'rel': 'flat'},\n",
" 61: {'address': 61,\n",
" 'word': 'Pekan',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 60,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'flat'},\n",
" 62: {'address': 62,\n",
" 'word': 'memuji',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 55,\n",
" 'deps': defaultdict(list, {'obj': [63]}),\n",
" 'rel': 'acl'},\n",
" 63: {'address': 63,\n",
" 'word': 'sikap',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 62,\n",
" 'deps': defaultdict(list, {'flat': [64], 'acl': [69]}),\n",
" 'rel': 'obj'},\n",
" 64: {'address': 64,\n",
" 'word': 'Ahli',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 63,\n",
" 'deps': defaultdict(list, {'flat': [65]}),\n",
" 'rel': 'flat'},\n",
" 65: {'address': 65,\n",
" 'word': 'Parlimen',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 64,\n",
" 'deps': defaultdict(list, {'flat': [66]}),\n",
" 'rel': 'flat'},\n",
" 66: {'address': 66,\n",
" 'word': 'Langkawi',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 65,\n",
" 'deps': defaultdict(list, {'det': [67]}),\n",
" 'rel': 'flat'},\n",
" 67: {'address': 67,\n",
" 'word': 'itu',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 66,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'det'},\n",
" 68: {'address': 68,\n",
" 'word': 'yang',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 69,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'nsubj'},\n",
" 69: {'address': 69,\n",
" 'word': 'mengaku',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 63,\n",
" 'deps': defaultdict(list, {'nsubj': [68], 'xcomp': [70]}),\n",
" 'rel': 'acl'},\n",
" 70: {'address': 70,\n",
" 'word': 'bersalah',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 69,\n",
" 'deps': defaultdict(list, {'xcomp': [72]}),\n",
" 'rel': 'xcomp'},\n",
" 71: {'address': 71,\n",
" 'word': 'selepas',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 72,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'case'},\n",
" 72: {'address': 72,\n",
" 'word': 'melanggar',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 70,\n",
" 'deps': defaultdict(list,\n",
" {'case': [71], 'obj': [73], 'advcl': [76]}),\n",
" 'rel': 'xcomp'},\n",
" 73: {'address': 73,\n",
" 'word': 'SOP',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 72,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'obj'},\n",
" 74: {'address': 74,\n",
" 'word': 'kerana',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 76,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'mark'},\n",
" 76: {'address': 76,\n",
" 'word': 'mengambil',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 72,\n",
" 'deps': defaultdict(list,\n",
" {'mark': [74],\n",
" 'advmod': [75],\n",
" 'obj': [77],\n",
" 'advcl': [80]}),\n",
" 'rel': 'advcl'},\n",
" 75: {'address': 75,\n",
" 'word': 'tidak',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 76,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'advmod'},\n",
" 77: {'address': 77,\n",
" 'word': 'suhu',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 76,\n",
" 'deps': defaultdict(list, {'compound': [78]}),\n",
" 'rel': 'obj'},\n",
" 78: {'address': 78,\n",
" 'word': 'badan',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 77,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'compound'},\n",
" 79: {'address': 79,\n",
" 'word': 'ketika',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 80,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'mark'},\n",
" 80: {'address': 80,\n",
" 'word': 'masuk',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 76,\n",
" 'deps': defaultdict(list, {'mark': [79], 'obl': [83, 85, 87]}),\n",
" 'rel': 'advcl'},\n",
" 81: {'address': 81,\n",
" 'word': 'ke',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 83,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'case'},\n",
" 83: {'address': 83,\n",
" 'word': 'surau',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 80,\n",
" 'deps': defaultdict(list, {'case': [81], 'det': [82]}),\n",
" 'rel': 'obl'},\n",
" 82: {'address': 82,\n",
" 'word': 'sebuah',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 83,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'det'},\n",
" 84: {'address': 84,\n",
" 'word': 'di',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 85,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'case'},\n",
" 85: {'address': 85,\n",
" 'word': 'Langkawi',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 80,\n",
" 'deps': defaultdict(list, {'case': [84]}),\n",
" 'rel': 'obl'},\n",
" 86: {'address': 86,\n",
" 'word': 'pada',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 87,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'case'},\n",
" 87: {'address': 87,\n",
" 'word': 'Sabtu',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 80,\n",
" 'deps': defaultdict(list, {'case': [86], 'amod': [88]}),\n",
" 'rel': 'obl'},\n",
" 88: {'address': 88,\n",
" 'word': 'lalu',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 87,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'amod'},\n",
" 89: {'address': 89,\n",
" 'word': '.',\n",
" 'lemma': '_',\n",
" 'ctag': '_',\n",
" 'tag': '_',\n",
" 'feats': '_',\n",
" 'head': 42,\n",
" 'deps': defaultdict(list, {}),\n",
" 'rel': 'punct'}})"
]
},
"execution_count": 17,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"graph.nodes"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#### Flat the graph"
]
},
{
"cell_type": "code",
"execution_count": 20,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"[(('melihat', '_'), 'nsubj', ('KUALA', '_')),\n",
" (('KUALA', '_'), 'flat', ('LUMPUR', '_')),\n",
" (('KUALA', '_'), 'obl', ('hal', '_')),\n",
" (('hal', '_'), 'punct', (':', '_')),\n",
" (('hal', '_'), 'case', ('Dalam', '_')),\n",
" (('hal', '_'), 'compound', ('politik', '_')),\n",
" (('KUALA', '_'), 'punct', (',', '_')),\n",
" (('melihat', '_'), 'advmod', ('jarang', '_')),\n",
" (('melihat', '_'), 'advmod', ('sekali', '_')),\n",
" (('melihat', '_'), 'case', ('untuk', '_')),\n",
" (('melihat', '_'), 'advcl', ('mempunyai', '_')),\n",
" (('mempunyai', '_'), 'obj', ('figura', '_')),\n",
" (('figura', '_'), 'nummod', ('dua', '_')),\n",
" (('figura', '_'), 'punct', ('-', '_')),\n",
" (('figura', '_'), 'compound:plur', ('bekas', '_')),\n",
" (('figura', '_'), 'flat', ('Perdana', '_')),\n",
" (('Perdana', '_'), 'det', ('ini', '_')),\n",
" (('Perdana', '_'), 'flat', ('Menteri', '_')),\n",
" (('Perdana', '_'), 'punct', (',', '_')),\n",
" (('Perdana', '_'), 'appos', ('Datuk', '_')),\n",
" (('Datuk', '_'), 'flat', ('Seri', '_')),\n",
" (('Seri', '_'), 'flat', ('Najib', '_')),\n",
" (('Najib', '_'), 'flat', ('Razak', '_')),\n",
" (('Perdana', '_'), 'conj', ('Tun', '_')),\n",
" (('Tun', '_'), 'cc', ('dan', '_')),\n",
" (('Tun', '_'), 'flat', ('Dr', '_')),\n",
" (('Dr', '_'), 'flat', ('Mahathir', '_')),\n",
" (('Mahathir', '_'), 'flat', ('Mohamad', '_')),\n",
" (('mempunyai', '_'), 'obj', ('pandangan', '_')),\n",
" (('pandangan', '_'), 'punct', (\"'\", '_')),\n",
" (('pandangan', '_'), 'amod', ('sama', '_')),\n",
" (('sama', '_'), 'conj', ('sekapal', '_')),\n",
" (('sekapal', '_'), 'nsubj', ('yang', '_')),\n",
" (('sekapal', '_'), 'punct', (\"'\", '_')),\n",
" (('sekapal', '_'), 'cc', ('atau', '_')),\n",
" (('mempunyai', '_'), 'punct', ('.', '_')),\n",
" (('mempunyai', '_'), 'mark', ('Namun', '_')),\n",
" (('melihat', '_'), 'dep', ('berbeza', '_')),\n",
" (('berbeza', '_'), 'punct', (',', '_')),\n",
" (('berbeza', '_'), 'nsubj', ('situasi', '_')),\n",
" (('situasi', '_'), 'det', ('itu', '_')),\n",
" (('berbeza', '_'), 'advcl', ('melibatkan', '_')),\n",
" (('melibatkan', '_'), 'mark', ('apabila', '_')),\n",
" (('melibatkan', '_'), 'obj', ('isu', '_')),\n",
" (('isu', '_'), 'compound', ('ketidakpatuhan', '_')),\n",
" (('isu', '_'), 'nmod', ('prosedur', '_')),\n",
" (('prosedur', '_'), 'case', ('terhadap', '_')),\n",
" (('prosedur', '_'), 'compound', ('operasi', '_')),\n",
" (('prosedur', '_'), 'amod', ('standard', '_')),\n",
" (('prosedur', '_'), 'appos', ('SOP', '_')),\n",
" (('SOP', '_'), 'punct', ('(', '_')),\n",
" (('SOP', '_'), 'punct', (')', '_')),\n",
" (('berbeza', '_'), 'punct', ('.', '_')),\n",
" (('berbeza', '_'), 'dep', ('Najib', '_')),\n",
" (('Najib', '_'), 'punct', (',', '_')),\n",
" (('Najib', '_'), 'nsubj', ('Ahli', '_')),\n",
" (('Ahli', '_'), 'nsubj', ('yang', '_')),\n",
" (('Ahli', '_'), 'advmod', ('juga', '_')),\n",
" (('Ahli', '_'), 'flat', ('Parlimen', '_')),\n",
" (('Parlimen', '_'), 'flat', ('Pekan', '_')),\n",
" (('Najib', '_'), 'acl', ('memuji', '_')),\n",
" (('memuji', '_'), 'obj', ('sikap', '_')),\n",
" (('sikap', '_'), 'flat', ('Ahli', '_')),\n",
" (('Ahli', '_'), 'flat', ('Parlimen', '_')),\n",
" (('Parlimen', '_'), 'flat', ('Langkawi', '_')),\n",
" (('Langkawi', '_'), 'det', ('itu', '_')),\n",
" (('sikap', '_'), 'acl', ('mengaku', '_')),\n",
" (('mengaku', '_'), 'nsubj', ('yang', '_')),\n",
" (('mengaku', '_'), 'xcomp', ('bersalah', '_')),\n",
" (('bersalah', '_'), 'xcomp', ('melanggar', '_')),\n",
" (('melanggar', '_'), 'case', ('selepas', '_')),\n",
" (('melanggar', '_'), 'obj', ('SOP', '_')),\n",
" (('melanggar', '_'), 'advcl', ('mengambil', '_')),\n",
" (('mengambil', '_'), 'mark', ('kerana', '_')),\n",
" (('mengambil', '_'), 'advmod', ('tidak', '_')),\n",
" (('mengambil', '_'), 'obj', ('suhu', '_')),\n",
" (('suhu', '_'), 'compound', ('badan', '_')),\n",
" (('mengambil', '_'), 'advcl', ('masuk', '_')),\n",
" (('masuk', '_'), 'mark', ('ketika', '_')),\n",
" (('masuk', '_'), 'obl', ('surau', '_')),\n",
" (('surau', '_'), 'case', ('ke', '_')),\n",
" (('surau', '_'), 'det', ('sebuah', '_')),\n",
" (('masuk', '_'), 'obl', ('Langkawi', '_')),\n",
" (('Langkawi', '_'), 'case', ('di', '_')),\n",
" (('masuk', '_'), 'obl', ('Sabtu', '_')),\n",
" (('Sabtu', '_'), 'case', ('pada', '_')),\n",
" (('Sabtu', '_'), 'amod', ('lalu', '_')),\n",
" (('berbeza', '_'), 'punct', ('.', '_'))]"
]
},
"execution_count": 20,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"list(graph.triples())"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#### Check the graph contains cycles"
]
},
{
"cell_type": "code",
"execution_count": 21,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"False"
]
},
"execution_count": 21,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"graph.contains_cycle()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"#### Generate networkx\n",
"\n",
"Make sure you already installed networkx, \n",
"\n",
"```bash\n",
"pip install networkx\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 22,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
""
]
},
"execution_count": 22,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"digraph = graph.to_networkx()\n",
"digraph"
]
},
{
"cell_type": "code",
"execution_count": 23,
"metadata": {},
"outputs": [
{
"data": {
"image/png": "\n",
"text/plain": [
""
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"import networkx as nx\n",
"import matplotlib.pyplot as plt\n",
"nx.draw_networkx(digraph)\n",
"plt.show()"
]
},
{
"cell_type": "code",
"execution_count": 24,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"OutMultiEdgeDataView([(1, 11), (2, 1), (3, 5), (4, 5), (5, 1), (6, 5), (7, 1), (8, 11), (9, 11), (10, 11), (12, 13), (13, 29), (14, 17), (15, 13), (16, 13), (17, 13), (18, 17), (19, 17), (20, 17), (21, 20), (22, 21), (23, 22), (24, 25), (25, 17), (26, 25), (27, 26), (28, 27), (29, 11), (30, 31), (31, 29), (32, 36), (33, 31), (34, 36), (35, 36), (36, 33), (37, 29), (38, 29), (39, 42), (40, 42), (41, 40), (42, 11), (43, 44), (44, 42), (45, 44), (46, 45), (47, 48), (48, 45), (49, 48), (50, 48), (51, 52), (52, 48), (53, 52), (54, 42), (55, 42), (56, 55), (57, 59), (58, 59), (59, 55), (60, 59), (61, 60), (62, 55), (63, 62), (64, 63), (65, 64), (66, 65), (67, 66), (68, 69), (69, 63), (70, 69), (71, 72), (72, 70), (73, 72), (74, 76), (75, 76), (76, 72), (77, 76), (78, 77), (79, 80), (80, 76), (81, 83), (82, 83), (83, 80), (84, 85), (85, 80), (86, 87), (87, 80), (88, 87), (89, 42)])"
]
},
"execution_count": 24,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"digraph.edges()"
]
},
{
"cell_type": "code",
"execution_count": 25,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"NodeView((1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89))"
]
},
"execution_count": 25,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"digraph.nodes()"
]
},
{
"cell_type": "code",
"execution_count": 26,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"{1: 'KUALA',\n",
" 2: 'LUMPUR',\n",
" 3: ':',\n",
" 4: 'Dalam',\n",
" 5: 'hal',\n",
" 6: 'politik',\n",
" 7: ',',\n",
" 8: 'jarang',\n",
" 9: 'sekali',\n",
" 10: 'untuk',\n",
" 11: 'melihat',\n",
" 12: 'dua',\n",
" 13: 'figura',\n",
" 14: 'ini',\n",
" 15: '-',\n",
" 16: 'bekas',\n",
" 17: 'Perdana',\n",
" 18: 'Menteri',\n",
" 19: ',',\n",
" 20: 'Datuk',\n",
" 21: 'Seri',\n",
" 22: 'Najib',\n",
" 23: 'Razak',\n",
" 24: 'dan',\n",
" 25: 'Tun',\n",
" 26: 'Dr',\n",
" 27: 'Mahathir',\n",
" 28: 'Mohamad',\n",
" 29: 'mempunyai',\n",
" 30: \"'\",\n",
" 31: 'pandangan',\n",
" 32: 'yang',\n",
" 33: 'sama',\n",
" 34: \"'\",\n",
" 35: 'atau',\n",
" 36: 'sekapal',\n",
" 37: '.',\n",
" 38: 'Namun',\n",
" 39: ',',\n",
" 40: 'situasi',\n",
" 41: 'itu',\n",
" 42: 'berbeza',\n",
" 43: 'apabila',\n",
" 44: 'melibatkan',\n",
" 45: 'isu',\n",
" 46: 'ketidakpatuhan',\n",
" 47: 'terhadap',\n",
" 48: 'prosedur',\n",
" 49: 'operasi',\n",
" 50: 'standard',\n",
" 51: '(',\n",
" 52: 'SOP',\n",
" 53: ')',\n",
" 54: '.',\n",
" 55: 'Najib',\n",
" 56: ',',\n",
" 57: 'yang',\n",
" 58: 'juga',\n",
" 59: 'Ahli',\n",
" 60: 'Parlimen',\n",
" 61: 'Pekan',\n",
" 62: 'memuji',\n",
" 63: 'sikap',\n",
" 64: 'Ahli',\n",
" 65: 'Parlimen',\n",
" 66: 'Langkawi',\n",
" 67: 'itu',\n",
" 68: 'yang',\n",
" 69: 'mengaku',\n",
" 70: 'bersalah',\n",
" 71: 'selepas',\n",
" 72: 'melanggar',\n",
" 73: 'SOP',\n",
" 74: 'kerana',\n",
" 75: 'tidak',\n",
" 76: 'mengambil',\n",
" 77: 'suhu',\n",
" 78: 'badan',\n",
" 79: 'ketika',\n",
" 80: 'masuk',\n",
" 81: 'ke',\n",
" 82: 'sebuah',\n",
" 83: 'surau',\n",
" 84: 'di',\n",
" 85: 'Langkawi',\n",
" 86: 'pada',\n",
" 87: 'Sabtu',\n",
" 88: 'lalu',\n",
" 89: '.'}"
]
},
"execution_count": 26,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"labels = {i:graph.get_by_address(i)['word'] for i in digraph.nodes()}\n",
"labels"
]
},
{
"cell_type": "code",
"execution_count": 27,
"metadata": {},
"outputs": [
{
"data": {
"image/png": "\n",
"text/plain": [
""
]
},
"metadata": {},
"output_type": "display_data"
}
],
"source": [
"plt.figure(figsize=(15,5))\n",
"nx.draw_networkx(digraph,labels=labels)\n",
"plt.show()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"### Vectorize\n",
"\n",
"Let say you want to visualize word level in lower dimension, you can use `model.vectorize`,\n",
"\n",
"```python\n",
"def vectorize(self, string: str):\n",
" \"\"\"\n",
" vectorize a string.\n",
"\n",
" Parameters\n",
" ----------\n",
" string: List[str]\n",
"\n",
" Returns\n",
" -------\n",
" result: np.array\n",
" \"\"\"\n",
"```"
]
},
{
"cell_type": "code",
"execution_count": 28,
"metadata": {},
"outputs": [],
"source": [
"r = quantized_model.vectorize(s)"
]
},
{
"cell_type": "code",
"execution_count": 29,
"metadata": {},
"outputs": [],
"source": [
"x = [i[0] for i in r]\n",
"y = [i[1] for i in r]"
]
},
{
"cell_type": "code",
"execution_count": 30,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"(89, 2)"
]
},
"execution_count": 30,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"from sklearn.manifold import TSNE\n",
"import matplotlib.pyplot as plt\n",
"\n",
"tsne = TSNE().fit_transform(y)\n",
"tsne.shape"
]
},
{
"cell_type": "code",
"execution_count": 31,
"metadata": {},
"outputs": [
{
"data": {
"image/png": "\n",
"text/plain": [
""
]
},
"metadata": {
"needs_background": "light"
},
"output_type": "display_data"
}
],
"source": [
"plt.figure(figsize = (7, 7))\n",
"plt.scatter(tsne[:, 0], tsne[:, 1])\n",
"labels = x\n",
"for label, x, y in zip(\n",
" labels, tsne[:, 0], tsne[:, 1]\n",
"):\n",
" label = (\n",
" '%s, %.3f' % (label[0], label[1])\n",
" if isinstance(label, list)\n",
" else label\n",
" )\n",
" plt.annotate(\n",
" label,\n",
" xy = (x, y),\n",
" xytext = (0, 0),\n",
" textcoords = 'offset points',\n",
" )"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "Python 3",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.7.7"
}
},
"nbformat": 4,
"nbformat_minor": 2
}