深入淺析Python數據分析的過程記錄

一、需求介紹

該需求主要是分析某一種數據的歷史數據。

客戶的需求是根據該數據的前兩期的情況,如果存在某個斜著的兩個數字相等,那麼就買第三期的同一個位置處的彩票,
對於1、,如果相等的數字是:1-5,那就買6-10,如果相等的數字是:6-10,那就買1-5;
對於2、,如果相等的數字是:1-5,那就買1-5,如果相等的數字是:6-10,,那就買6-10。

然後,根據這個方案,有可能會買中,但是也有可能買不中,於是,客戶希望我可以統計出來在100天中,按照這種方法,連續6次以及6次以上的購買彩票才能夠命中一次獎的次數以及分別所對應的時間,對於這個案例,我們下面詳細分析。

二、以第1、個為例進行數據分析

(在這裡,我們先利用 Jupyter Notebook 來進行分析,然後,在得到成果以後,利用 Pycharm 來進行完整的程序設計。)

1、獲取一天的數據

打開如下圖所示的界面可以獲取到網址以及請求頭:
1、網址(歷史數據的網址)

在這裡插入圖片描述

2、請求頭

在這裡插入圖片描述

然後我們在程序中進行代碼書寫獲取數據:

在這裡插入圖片描述

在這裡插入圖片描述

然後進行一定的預處理:

在這裡插入圖片描述

2、開始一天的數據的分析

這裡我們直接展示代碼:

def reverse_list(lst):
    """
    準換列表的先後順序
    :param lst: 原始列表
    :return: 新的列表
    """
    return [ele for ele in reversed(lst)]
low_list = ["01", "02", "03", "04", "05"]
# 設置比較小的數字的列表
high_list = ["06", "07", "08", "09", "10"]
# 設置比較大的數字的列表
N = 0
# 設置一個數字N來記錄一共有多少期可以購買
n = 0
# 設置一個數字n來記錄命中瞭多少期彩票
record_number = 1  
# 設置記錄數據的一個判斷值
list_data_number = []
# 設置一個空的列表來存儲一天之中的連續掛掉的期數
dict_time_record = {}
# 設置一個空的字典來存儲連掛掉的期數滿足所列條件的時間節點
for k in range(1152):  
    # 循環遍歷所有的數據點
    if k < 1150:
        new_result1 = reverse_list(new_response["result"]["data"])[k]  
        # 第一期數據
        new_result2 = reverse_list(new_response["result"]["data"])[k + 1]  
        # 第二期數據
        new_result3 = reverse_list(new_response["result"]["data"])[k + 2]  
        # 第三期數據
        data1 = new_result1['preDrawCode'].split(',')
        # 第一期數據
        data2 = new_result2['preDrawCode'].split(',')
        # 第二期數據
        data3 = new_result3['preDrawCode'].split(',')
        # 第三期數據
        for m in range(10):
            # 通過循環來判斷是否滿足購買的條件,並且實現一定的功能
            if m == 0:
                if data2[0] == data1[1]:  
                    # 如果相等就要結束循環
                    N += 1
                    # 可以購買的期數應該要自加一
                    if (data2[0] in low_list and data3[0] in low_list) or (data2[0] in high_list and data3[0] in high_list):
                        n += 1
                        # 命中的期數應該要自加一
                        # 如果命中瞭的話,本輪結束,開啟下一輪
                        list_data_number.append(record_number)
                        if f"{record_number}" in dict_time_record.keys():
                            # 如果已經有瞭這個鍵,那麼值添加時間點
                            dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                        else:
                            # 如果沒有這個鍵,那麼添加一個鍵值對,值為一個列表,而且初始化為當前的時間
                            dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                        record_number = 1  
                        # 初始化下一輪的開始
                    else:
                        record_number += 1  
                        # 如果沒有命中的話,次數就應該要自加一
                    break  
                    # 如果滿足相等的條件就要結束循環
            elif m == 9:  
                # 與上面差不多的算法
                if data2[9] == data1[8]:  
                    # 如果相等
                    N += 1
                    if (data2[9] in low_list and data3[9] in low_list) or (data2[9] in high_list and data3[9] in high_list):
                        n += 1
                        list_data_number.append(record_number)
                        if f"{record_number}" in dict_time_record.keys():
                            dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                        else:
                            dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                        record_number = 1
                    else:
                        record_number += 1
                    break
            else:  
                # 與上面差不多的算法
                if data2[m] == data1[m + 1] or data2[m] == data1[m - 1]:  
                    # 如果相等
                    N += 1
                    if (data2[m] in low_list and data3[m] in low_list) or (data2[m] in high_list and data3[m] in high_list):
                        n += 1
                        list_data_number.append(record_number)
                        if f"{record_number}" in dict_time_record.keys():
                            dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                        else:
                            dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                        record_number = 1
                    else:
                        record_number += 1
                    break
print(f"日期:{new_response['result']['data'][0]['preDrawTime'][:10]},總的梯子數為{N}個,一共有{n}次命中,一共有{N - n}次掛瞭")
# 打印時間,以及,可以購買的期數,命中的期數,沒有命中的期數
list_data_number.sort()
# 按照大小順序來進行排序
dict_record = {}
# 設置空字典進行記錄
for i in list_data_number:
    if f"{i}" in dict_record.keys():  # 判斷是否已經有瞭這個數字?
        dict_record[f"{i}"] += 1
        # 如果有的話,那麼就會自加一
    else:  # 如果沒有的話,那麼就會創建並且賦值等於 1
        dict_record[f"{i}"] = 1
        # 創建一個新的字典元素,然後進行賦值為 1
for j in dict_record.keys():
    if (int(j) >= 6) and (int(j) < 15):
        # 實際的結果表明,我們需要的是大於等於6期的數據,而沒有出現大於15的數據,因此有這樣的一個關系式
        print(f"買{j}次才中獎的次數為{dict_record[j]}")
        # 打印相關信息
        print(dict_time_record[j])
        str0 = ""
        for letter in dict_time_record[j]:
            str0 += letter
            str0 += ", "
        print(str0)
        # 打印相關信息

運行結果的展示如下圖所示:

在這裡插入圖片描述

3、循環日期進行多天的數據分析:

首先設置一個事件列表來記錄需要統計哪些天的數據:
代碼:

data_list = []
for h in range(31):
    data_list.append(f'1-{h + 1}')
for h in range(28):
    data_list.append(f'2-{h + 1}')
for h in range(31):
    data_list.append(f'3-{h + 1}')
for h in range(20):
    data_list.append(f'4-{h + 1}')

通過上述的代碼,我們即實現瞭時間列表的設置,然後我們循環遍歷這個列表訪問不同日期的彩票數據即就是得到瞭不同時間的數據,然後再利用上述的分析方法來進行數據分析,即就是可以得到瞭多天的彩票數據分析的結果瞭。

4、將數據寫入Excel表格中

這裡我們可以采用xlwt 模塊來進行excel表格的寫入操作啦,具體的寫入就不必過多贅述瞭。

三、完整的代碼展示:

一下是完整的代碼:

import requests
import chardet
import json
import xlwt  # excel 表格數據處理的對應模塊
def reverse_list(lst):
    """
    準換列表的先後順序
    :param lst: 原始列表
    :return: 新的列表
    """
    return [ele for ele in reversed(lst)]
data_list = []
for h in range(31):
    data_list.append(f'1-{h + 1}')
for h in range(28):
    data_list.append(f'2-{h + 1}')
for h in range(31):
    data_list.append(f'3-{h + 1}')
for h in range(20):
    data_list.append(f'4-{h + 1}')
wb = xlwt.Workbook()  # 創建 excel 表格
sh = wb.add_sheet('彩票分析數據處理')  # 創建一個 表單
sh.write(0, 0, "日期")
sh.write(0, 1, "梯子數目")
sh.write(0, 2, "命中數目")
sh.write(0, 3, "掛的數目")
sh.write(0, 4, "6次中的數目")
sh.write(0, 5, "6次中的時間")
sh.write(0, 6, "7次中的數目")
sh.write(0, 7, "7次中的時間")
sh.write(0, 8, "8次中的數目")
sh.write(0, 9, "8次中的時間")
sh.write(0, 10, "9次中的數目")
sh.write(0, 11, "9次中的時間")
sh.write(0, 12, "10次中的數目")
sh.write(0, 13, "10次中的時間")
sh.write(0, 14, "11次中的數目")
sh.write(0, 15, "11次中的時間")
sh.write(0, 16, "12次中的數目")
sh.write(0, 17, "12次中的時間")
sh.write(0, 18, "13次中的數目")
sh.write(0, 19, "13次中的時間")
sh.write(0, 20, "14次中的數目")
sh.write(0, 21, "14次中的時間")
# wb.save('test4.xls')
sheet_seek_position = 1
# 設置表格的初始位置為 1
for data in data_list:
    low_list = ["01", "02", "03", "04", "05"]
    high_list = ["06", "07", "08", "09", "10"]
    N = 0
    n = 0
    url = f'https://api.api68.com/pks/getPksHistoryList.do?date=2021-{data}&lotCode=10037'
    headers = {
        'User-Agent':
            'Mozilla/5.0 (Windows NT 10.0; Win64; x64) '
            'AppleWebKit/537.36 (KHTML, like Gecko) '
            'Chrome/90.0.4430.72 Safari/537.36'
    }
    response = requests.get(url=url, headers=headers)
    response.encoding = chardet.detect(response.content)['encoding']
    new_response = json.loads(response.text)
    sh.write(sheet_seek_position, 0, new_response['result']['data'][0]['preDrawTime'][:10])
    # 在表格的第一個位置處寫入時間,意即:data
    record_number = 1  # 記錄數據的一個判斷值,設置為第一次,應該是要放在最外面的啦
    list_data_number = []
    # 設置一個空列表來存儲一天之中的連續掛的期數
    dict_time_record = {}
    for k in range(1152):
        # record_number = 1,應該要放外面
        # 記錄數據的一個判斷值,設置為第一次
        if k < 1150:
            new_result1 = reverse_list(new_response["result"]["data"])[k]
            new_result2 = reverse_list(new_response["result"]["data"])[k + 1]
            new_result3 = reverse_list(new_response["result"]["data"])[k + 2]
            data1 = new_result1['preDrawCode'].split(',')
            data2 = new_result2['preDrawCode'].split(',')
            data3 = new_result3['preDrawCode'].split(',')
            for m in range(10):
                if m == 0:
                    if data2[0] == data1[1]:
                        N += 1
                        if (data2[0] in low_list and data3[0] in high_list) or (data2[0] in high_list and data3[0] in low_list):
                            n += 1
                            # 如果命中瞭的話,本輪結束,開啟下一輪
                            list_data_number.append(record_number)
                            if f"{record_number}" in dict_time_record.keys():
                                dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                            else:
                                dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                            # print(record_number)
                            record_number = 1  # 初始化
                        else:
                            record_number += 1  # 沒中,次數加一
                            # 自加一
                        break
                elif m == 9:
                    if data2[9] == data1[8]:
                        N += 1
                        if (data2[9] in low_list and data3[9] in high_list) or (data2[9] in high_list and data3[9] in low_list):
                            n += 1
                            list_data_number.append(record_number)
                            if f"{record_number}" in dict_time_record.keys():
                                dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                            else:
                                dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                            # print(record_number)
                            record_number = 1
                        else:
                            record_number += 1
                        break
                else:
                    if data2[m] == data1[m + 1] or data2[m] == data1[m - 1]:
                        N += 1
                        if (data2[m] in low_list and data3[m] in high_list) or (data2[m] in high_list and data3[m] in low_list):
                            n += 1
                            list_data_number.append(record_number)
                            if f"{record_number}" in dict_time_record.keys():
                                dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                            else:
                                dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                            # print(record_number)
                            record_number = 1
                        else:
                            record_number += 1
                        break
    print(f"日期:{new_response['result']['data'][0]['preDrawTime'][:10]},總的梯子數為{N}個,一共有{n}次命中,一共有{N - n}次掛瞭")
    sh.write(sheet_seek_position, 1, N)
    sh.write(sheet_seek_position, 2, n)
    sh.write(sheet_seek_position, 3, N - n)
    # new_list_data_number = list_data_number.sort()
    list_data_number.sort()
    # 進行排序
    dict_record = {}
    # 設置空字典
    for i in list_data_number:
        if f"{i}" in dict_record.keys():  # 判斷是否已經有瞭這個數字?
            dict_record[f"{i}"] += 1
            # 如果有的話,那麼就會自加一
        else:  # 如果沒有的話,那麼就會創建並且賦值等於 1
            dict_record[f"{i}"] = 1
            # 創建一個新的字典元素,然後進行賦值為 1
    # print(dict_record)
    # print(f"買彩票第幾次才中獎?")
    # print(f"按照我們的規律買彩票的情況:")
    for j in dict_record.keys():
        if (int(j) >= 6) and (int(j) < 15):
            print(f"買{j}次才中獎的次數為{dict_record[j]}")
            print(dict_time_record[j])
            str0 = ""
            for letter in dict_time_record[j]:
                str0 += letter
                str0 += ", "
            print(str0)
            sh.write(sheet_seek_position, 4 + (int(j) - 6) * 2, dict_record[j])
            # 寫入幾次
            sh.write(sheet_seek_position, 4 + (int(j) - 6) * 2 + 1, str0[:-2])  
            # 註意這裡應該要改為 -2
            # 寫入幾次對應的時間
            # print(j)
    sheet_seek_position += 1
    # 每次寫完瞭以後,要對位置進行換行,換到下一行,從而方便下一行的寫入
# 保存
wb.save('極速飛艇彩票分析結果.xls')

運行結果展示:
展示1、

在這裡插入圖片描述

展示2、

在這裡插入圖片描述

從而,我們便解決瞭極速飛艇的彩票的數據分析

然後,我們隻需要稍稍改變一點點算法,其他的部分是完全一樣的啦,從而即就是可以實現極速賽車的數據分析瞭啦。
修改的代碼在下面列出來瞭:

 for m in range(10):
                if m == 0:
                    if data2[0] == data1[1]:
                        N += 1
                        if (data2[0] in low_list and data3[0] in low_list) or (data2[0] in high_list and data3[0] in high_list):
                            n += 1
                            # 如果命中瞭的話,本輪結束,開啟下一輪
                            list_data_number.append(record_number)
                            if f"{record_number}" in dict_time_record.keys():
                                dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                            else:
                                dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                            # print(record_number)
                            record_number = 1  # 初始化
                        else:
                            record_number += 1  # 沒中,次數加一
                            # 自加一
                        break
                elif m == 9:
                    if data2[9] == data1[8]:
                        N += 1
                        if (data2[9] in low_list and data3[9] in low_list) or (data2[9] in high_list and data3[9] in high_list):
                            n += 1
                            list_data_number.append(record_number)
                            if f"{record_number}" in dict_time_record.keys():
                                dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                            else:
                                dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                            # print(record_number)
                            record_number = 1
                        else:
                            record_number += 1
                        break
                else:
                    if data2[m] == data1[m + 1] or data2[m] == data1[m - 1]:
                        N += 1
                        if (data2[m] in low_list and data3[m] in low_list) or (data2[m] in high_list and data3[m] in high_list):
                            n += 1
                            list_data_number.append(record_number)
                            if f"{record_number}" in dict_time_record.keys():
                                dict_time_record[f"{record_number}"].append(new_result3['preDrawTime'][11:])
                            else:
                                dict_time_record[f"{record_number}"] = [new_result3['preDrawTime'][11:]]
                            # print(record_number)
                            record_number = 1
                        else:
                            record_number += 1
                        break

總結

總而言之,這個就是我學習 Python 到現在為止所接的第一單啦,這個需求不得不說確實是比較簡單的啦,但是,我在完成這個任務的過程中,的確是學到瞭以前一些我並不太註意的東西,同時呢,也熟練的掌握瞭一些編程的技巧,雖然說這種比較簡單的活報酬不會太高,但是,我認為在這個過程中我確實學到瞭不少東西,同時也成長瞭不少,因此,無論怎麼說,其實也都還是挺不錯的啦。
最後呢如果想瞭解我的第一次接單的程序運行實例,可以參見我的資源裡面的“第一次接單案例”視頻啦。。
最後感謝閱讀啦

到此這篇關於Python數據分析的過程記錄的文章就介紹到這瞭,更多相關Python數據分析內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: