Extracted methods

ef2f767f · Alexander Lercher · 1efb006e · ef2f767f
Commit ef2f767f authored Sep 23, 2019 by Alexander Lercher
Hide whitespace changes
Inline Side-by-side

Showing with 57 additions and 37 deletions

HyperGraph.py ...mantic-linking-microservice/app/initialdemo/HyperGraph.py +57 -37

No files found.
--- a/data-hub/semantic-linking-microservice/app/initialdemo/HyperGraph.py
+++ b/data-hub/semantic-linking-microservice/app/initialdemo/HyperGraph.py
 import json
-nodeIds = []
-destIds = []
+def do():
-clusterlabels = []
-destclusterlabel = []
-cluster = []
-labalvlues = []
-def classify():
    df_nodes = load_values()
-    for row in df_nodes:
+    ret_val = init(df_nodes)
+    nodeIds = ret_val['nodeIds']
+    clusterlabels = ret_val['clusterlabels']
+    destIds = ret_val['destIds']
+    clusterlabels = classify_input(nodeIds, clusterlabels)
+    labelvals = calc_cluster_num(clusterlabels)
+    cluster = cluster_with_labels(nodeIds, clusterlabels, labelvals)
+    cluster = remove_duplicates(cluster)
+    destclusterlabel = cluster_dest_ids(labelvals, cluster, destIds)
+def load_values():
+    with open("mult_in_out_large.json", "r") as json_file:
+        df_nodes = json.load(json_file)
+    return df_nodes
+def init(df_nodes):
+    nodeIds = []
+    clusterlabels = []
+    destIds = []
+    for row in df_nodes:
        for j in range(len(row['TransactionFrom'])):
            print("   Input Ids:  ", row['TransactionFrom'][j])
        nodeIds.append(row['TransactionFrom'])
        print("This is nodes:  ", nodeIds)
    for row in df_nodes:
       destIds.append(row['TransactionTo'])
    for row in range(len(nodeIds)):
        print(nodeIds[row])
    print("Finish InputIDs")
    i = 0
    for row in range(len(nodeIds)):
        clusterlabels.append(row)
        i += 1
    print(i)
+    return {'nodeIds': nodeIds,
+            'clusterlabels': clusterlabels,
+            'destIds': destIds}
+def classify_input(nodeIds, clusterlabels):
    """" classifying Inputs"""
    """" Labaling inputs"""
    for row in range(len(nodeIds)):
@@ -55,42 +76,43 @@ def classify():
                                  clusterlabels[row2] = clusterlabels[row1]
                          clusterlabels[row] = clusterlabels[row1]
    print(clusterlabels)
    print("cluster labels:", len(clusterlabels))
    print("NodeIDs:   ", len(nodeIds))
+    return clusterlabels
+def calc_cluster_num(clusterlabels):
    """" Calculating the number of clusters"""
-    clusternum = 1
+    labelvals = []
-    labalvlues.append(clusterlabels[0])
+    labelvals.append(clusterlabels[0])
    for row in range(len(clusterlabels)):
        flag = True
-        for row1 in range(len(labalvlues)):
+        for row1 in range(len(labelvals)):
-          if(clusterlabels[row]== labalvlues[row1]):
+          if(clusterlabels[row]== labelvals[row1]):
             flag = False
        if (flag):
-            clusternum = + 1
+            labelvals.append(clusterlabels[row])
-            labalvlues.append(clusterlabels[row])
-    print("label values (source Ids in the network):  ", labalvlues, " and the number of clusters is: ", len(labalvlues))
+    print("label values (source Ids in the network):  ", labelvals, " and the number of clusters is: ", len(labelvals))
+    return labelvals
+def cluster_with_labels(nodeIds, clusterlabels, labelvals):
    """" clustering Ids according to their labels"""
+    cluster = []
-    for row in range(len(labalvlues)):
+    for row in range(len(labelvals)):
        cluster.append([])
        for row3 in range(len(nodeIds)):
-            if (labalvlues[row] == clusterlabels[row3]):
+            if (labelvals[row] == clusterlabels[row3]):
                cluster[row].extend(nodeIds[row3])
    print("clusters:   ", cluster)
+    return cluster
+def remove_duplicates(cluster):
    """ Removing duplicating items in cluster"""
    flag = True
@@ -112,28 +134,26 @@ def classify():
            break
    print("cluster:", cluster)
+    return cluster
+def cluster_dest_ids(labelvals, cluster, destIds):
    """" Clustering  Destination Ids """
+    destclusterlabel = []
    for row in range(len(destIds)):
        destclusterlabel.append([])
        for row2 in range(len(destIds[row])):
            flag = True
-            for rownum in range(len(labalvlues)):
+            for rownum in range(len(labelvals)):
                for row1 in range(len(cluster[rownum])):
                   if(destIds[row][row2]== cluster[rownum][row1]):
-                        destclusterlabel[row].append(labalvlues[rownum])
+                        destclusterlabel[row].append(labelvals[rownum])
                        flag = False
            if(flag):
                destclusterlabel.append(destIds[row][row2])
    print("destination labels (destination Ids):  ", destclusterlabel)
-def load_values():
+    return destclusterlabel
-    with open("mult_in_out_large.json", "r") as json_file:
\ No newline at end of file
-        df_nodes = json.load(json_file)
-    return df_nodes
\ No newline at end of file