alpcentaur
/
laywerrobot

# prototype User Interface
from sklearn.externals import joblibfrom sklearn.feature_extraction.text import CountVectorizer
import numpy as npimport scipy
import tensorflow as tf
import _pickle as cPickle
import hickle as hkl


# Load the Zeros and Ones of the database
#pickdbOZ = open("databaseOneZero/OnesZerosDB.bin","rb")#dbOZ = cPickle.load(pickdbOZ)#dbOZ = dbOZ.astype(np.float32, copy=False)
dbOZ = hkl.load('databaseOneZero/OnesZerosDB_gzip.hkl')
#print(array_hkl)
#numpyarray = np.load('databaseOneZero/OnesZerosDB.npy')
#print(numpyarray)
#print('pickle loaded:')#print('sum test1', sum(dbOZ[0]))#print('sum test2', sum(dbOZ[1]))#print('hdf5 loaded:')#print(array_hkl[1])#print('numpy loaded:')#print(numpyarray[1])
print(dbOZ)print(np.array(dbOZ))print(np.array(dbOZ).astype(np.float32, copy=False))
dbOZ = np.transpose(np.array(dbOZ)).astype(np.float32, copy=False)# Get the user input
user_input_words = input("Please describe your problem: ")
user_input_n = int(input("How many dokuments would you like to display?: "))# Convert user input to Zeros and Onesuser_array = []user_array.append(user_input_words)

vectorizer = joblib.load('models/bagofwords.pkl')
user_input_OnesZeros = vectorizer.transform(user_array)print(type(sum(user_input_OnesZeros[0])))print(user_input_OnesZeros)print(user_input_words)print(type(user_input_words))print(type(user_input_OnesZeros))uOZ = user_input_OnesZeros.toarray()[0].astype(np.float32, copy=False)print(type(sum(uOZ)))print(np.array(uOZ))
uiOZ = uOZ
#uiOZ = np.transpose(uOZ[np.newaxis, :])uiOZ = uOZ[np.newaxis, :]

print(uiOZ)sess = tf.Session()
with sess.as_default():    uiOZ_tensor = tf.constant(uiOZ)        dbOZ_tensor = tf.constant(dbOZ)        uiOZ_tensor_sparse =tf.contrib.layers.dense_to_sparse(uiOZ_tensor, eos_token=0, outputs_collections=None, scope=None )    dbOZ_tensor_sparse =tf.contrib.layers.dense_to_sparse(dbOZ_tensor, eos_token=0, outputs_collections=None, scope=None )            #wordCountDoku =  tf.matmul(uiOZ_tensor, dbOZ_tensor)    wordCountDoku =  tf.sparse_matmul(uiOZ_tensor, dbOZ_tensor)        wCD = np.array(wordCountDoku.eval()[0])        print(type(wCD))        print('end',wordCountDoku.eval())

indexedwCD = []for n in range(len(wCD)):    indexedwCD.append([wCD[n],n])
print(indexedwCD)

indexedwCD = np.transpose(np.array(indexedwCD))
print(indexedwCD)

indexedwCD = sorted(indexedwCD, key=lambda tup: tup[1], reverse=False)print(indexedwCD)

for n in range(user_input_n):    print(indexedwCD[n][1])

# Calculate the best matching parallelized with tf


# Get the id of documents which fit the best
# Display the n best matching dokuments