ppisljar
/

slo_g2p_byt5

Model card Files Files and versions

ppisljar commited on Feb 16, 2024

Commit

768ff29

·

verified ·

1 Parent(s): 5d224b7

Update infer.py

Files changed (1) hide show

infer.py +17 -10

infer.py CHANGED Viewed

@@ -8,13 +8,20 @@ tokenizer = AutoTokenizer.from_pretrained('google/byt5-small')
 sentence = "Kupil sem bicikel in mu zamenjal stol.".lower()
 ort_session = onnxruntime.InferenceSession("g2p_t5.onnx", providers=["CPUExecutionProvider"])
-input_ids = [sentence]
-input_encoding = tokenizer(
-    input_ids, padding='longest', max_length=512, truncation=True, return_tensors='pt',
-)
-input_ids, attention_mask = input_encoding.input_ids, input_encoding.attention_mask
-ort_inputs = {'input_ids': input_ids.numpy()}
-ort_outs = ort_session.run(None, ort_inputs)
-generated_ids = [ort_outs[0]]
-generated_texts = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
-print(generated_texts)

 sentence = "Kupil sem bicikel in mu zamenjal stol.".lower()
 ort_session = onnxruntime.InferenceSession("g2p_t5.onnx", providers=["CPUExecutionProvider"])
+def g2p(sentence, onnx_session, tokenizer):
+    input_ids = [sentence]
+    input_encoding = tokenizer(
+        input_ids, padding='longest', max_length=512, truncation=True, return_tensors='pt',
+    )
+    input_ids, attention_mask = input_encoding.input_ids, input_encoding.attention_mask
+    ort_inputs = {'input_ids': input_ids.numpy()}
+    ort_outs = ort_session.run(None, ort_inputs)
+    generated_ids = [ort_outs[0]]
+    generated_texts = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)
+    return generated_texts
+result = g2p(sentence, ort_session, tokenizer)
+print(result)