Since I don't have Telugu accessible in my console least demanding answer was to run your python session in a program by utilizing Jupyter - that way you dispose of a ton of issues around the terminal character set, and so on
At that point I could basically print the outcomes:
s = "నా పేరు కరీం ఉంది. నేను భారత ఆహార ప్రేమ.".decode('utf-8')
a = s.split()
for i in a:
print(i)
నా
పేరు
కరీం
ఉంది.
నేను
భారత
ఆహార
ప్రేమ.
Note that when placing such a thing into a script file you need to begin the document with the magic lines:
#!/usr/bin/env python
#coding:utf-8
Having derived that the OP was running python2 I have tested and discovered that - in a terminal that underpins utf-8 - the accompanying give results that appear to be acceptable when run from a script file:
#!/usr/bin/env python
# coding: utf-8
from __future__ import print_function
import nltk
s = "నా పేరు కరీం ఉంది. నేను భారత ఆహార ప్రేమ." #.decode('utf-8')
a = s.split()
for i in a:
print(i)
text = nltk.word_tokenize(s.decode('utf-8'))
result = nltk.pos_tag(text)
for val in result:
print (list(val)[0].encode('utf-8'), list(val)[1])
$ python Untitled2.py
నా
పేరు
కరీం
ఉంది.
నేను
భారత
ఆహార
ప్రేమ.
నా JJ
పేరు NNP
కరీం NNP
ఉంది NNP
. .
నేను VB
భారత JJ
ఆహార NNP
ప్రేమ NNP
. .
Want to become a expert in Python? Join the python course fast!
For more details, do check out the below video tutorial...