python如何讀取.mtx文件
mtx文件是按照稀疏矩陣格式存儲的矩陣數據,可以按照以下步驟讀取:
1、安裝scanpy包
pip install scanpy
2、文件讀取
import scanpy as sc adata = sc.read(filename) data = adata.X
第一行read之後返回的是annData,第二行通過.X操作得到的是矩陣數據
3、轉換為稠密矩陣
data = data.todense()
直接得到的矩陣是稀疏形式的,通過todense函數可轉換為稠密矩陣
補充:python讀取各種文件方式
Json:
use_time=[] with open(address,'r') as f: #ubuntu mobile = json.load(f) calls = mobile["transactions"][0]["calls"] for call in calls: use_time.append(str(call['use_time']))
Excel:
rawdata1=open_workbook(address) rawdata=rawdata1.sheet_by_index(0) for i in range(1,rawdata.nrows): if rawdata.cell(i,date_index).value=="": #跳過空行 continue else: if ctype==3: #若為3,則用datetime模塊處理日期 date1=rawdata.cell(i,date_index).value date2 = xldate_as_tuple(date1,0) date3=datetime(*date2) if "." in str(rawdata.cell(i,phone_index).value): phone1=str(rawdata.cell(i,phone_index).value)[:-2] else: phone1=str(rawdata.cell(i,phone_index).value)
寫EXCEL:
Excel_file = xlwt.Workbook() sheet = Excel_file.add_sheet('sheet0') header=[u'號碼','日期top1','日期top2','日期top3'] #寫入標題行: for i in range(len(header)): sheet.write(0,i,header[i]) #開始按行寫入數據: for i in range(len(phonelist)): sheet.write(i+1,0,phonelist[i]) sheet.write(i+1,1,dic[str(phonelist[i])]) #保存EXCEL: Excel_file.save("C:/Users/Desktop/100個文件輸出xls/"+str(fileName)+".xls")
CSV:
rawdata=pd.read_csv(address,skip_blank_lines=True) #參數為去除空行 if 'start_time' or 'begin_time' in rawdata.columns: if 'start_time' in rawdata.columns: start_time=rawdata['start_time'] elif 'begin_time' in rawdata.columns: start_time=rawdata['begin_time']
txt:
rawdata=open(address,'r') i=0 a=[] #c存放第一行的列名 for line in rawdata: if i==1: #默認第二行開始存儲通話數據 a=line.split(',') #逗號作為分隔符 for j in range(len(a)): #查找指定列名所在的列下標 if (('-' in str(a[j]))or('/' in str(a[j]))): #判斷日期所在列數 date_index=j #保存日期的列下標 elif str(a[j]).isdigit() and len(str(a[j]))>5: #默認全為數字組成的字符串為電話號碼 phone_index=j else: pass break else: i+=1 i=0 for line in rawdata:#開始轉存數據: if len(line)<10: #跳過空行 continue data_line=line.split(',') #txt默認以','分隔數據 if i==0: pass #第一行為列名,跳過 i+=1 else: #從第二行開始保存數據 start_time.append(data_line[date_index])
以上為個人經驗,希望能給大傢一個參考,也希望大傢多多支持WalkonNet。如有錯誤或未考慮完全的地方,望不吝賜教。
推薦閱讀:
- None Found