遊戲服務器中的Netty應用以及源碼剖析
一、Reactor模式和Netty線程模型
最近因為工作需要,學習瞭一段時間Netty的源碼,並做瞭一個簡單的分享,研究還不是特別深入,繼續努力。因為分享也不涉及公司業務,所以這裡也把這次對源碼的研究成果分享出來 以下都是在遊戲服務器開發中針對Netty使用需要瞭解知識點以及相關優化
這次分享主要設計以下內容
- Netty線程模型
- Netty對TCP相關參數的配置和具體含義
- Netty對Epoll的封裝
- Netty的優雅關閉
客戶端連接數的限制
- 內存資源
- CPU資源
端口號資源
cat /proc/sys/net/ipv4/ip_local_port_range
文件描述符資源
- 系統級:當前系統可打開的最大數量,通過 cat /proc/sys/fs/file-max 查看
- 用戶級:指定用戶可打開的最大數量,通過 cat /etc/security/limits.conf 查看
- 進程級:單個進程可打開的最大數量,通過 cat /proc/sys/fs/nr_open 查看
- 線程資源 BIO/NIO
1. BIO模型
- 所有操作都是同步阻塞(accept,read)
- 客戶端連接數與服務器線程數比例是1:1
2. NIO模型
- 非阻塞IO
- 通過selector實現可以一個線程管理多個連接
- 通過selector的事件註冊(OP_READ/OP_WRITE/OP_CONNECT/OP_ACCEPT),處理自己感興趣的事件
客戶端連接數與服務器線程數比例是n:1
3. Reacor模型
①. 單Reacor單線程模型
所有IO在同一個NIO線程完成(處理連接,分派請求,編碼,解碼,邏輯運算,發送)
優點:
- 編碼簡單
- 不存在共享資源競爭
- 並發安全
缺點:
- 單線程處理大量鏈路時,性能無法支撐,不能合理利用多核處理
- 線程過載後,處理速度變慢,會導致消息積壓
- 一旦線程掛掉,整個通信層不可用 redis使用的就是reactor單進程模型,redis由於都是內存級操作,所以使用此模式沒什麼問題
reactor單線程模型圖:
netty reactor單線程模型圖:
Netty對應實現方式
// Netty對應實現方式:創建io線程組是,boss和worker,使用同一個線程組,並且線程數為1 EventLoopGroup ioGroup = new NioEventLoopGroup(1); b.group(ioGroup, ioGroup) .channel(NioServerSocketChannel.class) .childHandler(initializer); ChannelFuture f = b.bind(portNumner); cf = f.sync(); f.get();
②. 單Reactor多線程模型
根據單線程模型,io處理中最耗時的編碼,解碼,邏輯運算等cpu消耗較多的部分,可提取出來使用多線程實現,並充分利用多核cpu的優勢
優點:
多線程處理邏輯運算,提高多核CPU利用率
缺點:
對於單Reactor來說,大量鏈接的IO事件處理依然是性能瓶頸
reactor多線程模型圖:
netty reactor多線程模型圖:
Netty對應實現方式
// Netty對應實現方式:創建io線程組是,boss和worker,使用同一個線程組,並且線程數為1,把邏輯運算部分投遞到用戶自定義線程處理 EventLoopGroup ioGroup = new NioEventLoopGroup(1); b.group(ioGroup, ioGroup) .channel(NioServerSocketChannel.class) .childHandler(initializer); ChannelFuture f = b.bind(portNumner); cf = f.sync(); f.get();
③. 主從Reactor多線程模型
根據多線程模型,可把它的性能瓶頸做進一步優化,即把reactor由單個改為reactor線程池,把原來的reactor分為mainReactor和subReactor
優點:
- 解決單Reactor的性能瓶頸問題(Netty/Nginx采用這種設計)
reactor主從多線程模型圖:
netty reactor主從多線程模型圖:
Netty對應實現方式
// Netty對應實現方式:創建io線程組boss和worker,boss線程數為1,work線程數為cpu*2(一般IO密集可設置為2倍cpu核數) EventLoopGroup bossGroup = new NioEventLoopGroup(1); EventLoopGroup workerGroup = new NioEventLoopGroup(); b.group(bossGroup, workerGroup) .channel(NioServerSocketChannel.class) .childHandler(initializer); ChannelFuture f = b.bind(portNumner); cf = f.sync(); f.get();
④. 部分源碼分析
- 創建group實例
// 1.構造參數不傳或傳0,默認取系統參數配置,沒有參數配置,取CPU核數*2 super(nThreads == 0 ? DEFAULT_EVENT_LOOP_THREADS : nThreads, executor, args); private static final int DEFAULT_EVENT_LOOP_THREADS; static { DEFAULT_EVENT_LOOP_THREADS = Math.max(1, SystemPropertyUtil.getInt( "io.netty.eventLoopThreads", NettyRuntime.availableProcessors() * 2)); } // 2.不同版本的JDK會有不同版本的SelectorProvider實現,Windows下的是WindowsSelectorProvider public NioEventLoopGroup(int nThreads, Executor executor) { //默認selector,最終實現類似:https://github.com/frohoff/jdk8u-jdk/blob/master/src/macosx/classes/sun/nio/ch/DefaultSelectorProvider.java //basic flow: 1 java.nio.channels.spi.SelectorProvider 2 META-INF/services 3 default this(nThreads, executor, SelectorProvider.provider()); } // 3.創建nThread個EventExecutor,並封裝到選擇器chooser,chooser會根據線程數分別有兩種實現(GenericEventExecutorChooser和PowerOfTwoEventExecutorChooser,算法不同,但實現邏輯一樣,就是均勻的分配線程處理) EventExecutorChooserFactory.EventExecutorChooser chooser; children = new EventExecutor[nThreads]; for (int i = 0; i < nThreads; i ++) { // ... children[i] = newChild(executor, args); // ... } chooser = chooserFactory.newChooser(children);
- 設置group
// 兩種方式設置group // parent和child使用同一個group,調用仍然是分別設置parent和child @Override public ServerBootstrap group(EventLoopGroup group) { return group(group, group); } ServerBootstrap.group(EventLoopGroup parentGroup, EventLoopGroup childGroup){ // 具體代碼略,可直接參考源碼 // 裡面實現內容是把parentGroup綁定到this.group,把childGroup綁定到this.childGroup }
- Netty啟動
// 調用順序 ServerBootstrap:bind() -> doBind() -> initAndRegister() private ChannelFuture doBind(final SocketAddress localAddress) { final ChannelFuture regFuture = initAndRegister(); // ... doBind0(regFuture, channel, localAddress, promise); // ... } final ChannelFuture initAndRegister() { // 創建ServerSocketChannel Channel channel = channelFactory.newChannel(); // ... // 開始register ChannelFuture regFuture = config().group().register(channel); // register調用順序 // next().register(channel) -> (EventLoop) super.next() -> chooser.next() // ... }
由以上源碼可得知,bind隻在起服調用一次,因此bossGroup僅調用一次regist,也就是僅調用一次next,因此隻有一根線程是有用的,其餘線程都是廢棄的,所以bossGroup線程數設置為1即可
// 啟動BossGroup線程並綁定本地SocketAddress private static void doBind0( final ChannelFuture regFuture, final Channel channel, final SocketAddress localAddress, final ChannelPromise promise) { channel.eventLoop().execute(new Runnable() { @Override public void run() { if (regFuture.isSuccess()) { channel.bind(localAddress, promise).addListener(ChannelFutureListener.CLOSE_ON_FAILURE); } else { promise.setFailure(regFuture.cause()); } } }); }
- 客戶端連接
// 消息事件讀取 NioEventLoop.run() -> processSelectedKeys() -> ... -> ServerBootstrapAcceptor.channelRead // ServerBootstrapAcceptor.channelRead處理客戶端連接事件 // 最後一行的childGroup.register的邏輯和上面的代碼調用處一樣 public void channelRead(ChannelHandlerContext ctx, Object msg) { child.pipeline().addLast(childHandler); setChannelOptions(child, childOptions, logger); setAttributes(child, childAttrs); childGroup.register(child) }
二、select/poll和epoll
1.概念
- select(時間復雜度O(n)):用一個fd數組保存所有的socket,然後通過死循環遍歷調用操作系統的select方法找到就緒的fd
while(1) { nready = select(list); // 用戶層依然要遍歷,隻不過少瞭很多無效的系統調用 for(fd <-- fdlist) { if(fd != -1) { // 隻讀已就緒的文件描述符 read(fd, buf); // 總共隻有 nready 個已就緒描述符,不用過多遍歷 if(--nready == 0) break; } } }
poll(時間復雜度O(n)):同select,不過把fd數組換成瞭fd鏈表,去掉瞭fd最大連接數(1024個)的數量限制
epoll(時間復雜度O(1)):解決瞭select/poll的幾個缺陷
- 調用需傳入整個fd數組或fd鏈表,需要拷貝數據到內核
- 內核層需要遍歷檢查文件描述符的就緒狀態
- 內核僅返回可讀文件描述符個數,用戶仍需自己遍歷所有fd
epoll是操作系統基於事件關聯fd,做瞭以下優化:
- 內核中保存一份文件描述符集合,無需用戶每次都重新傳入,隻需告訴內核修改的部分即可。(epoll_ctl)
- 內核不再通過輪詢的方式找到就緒的文件描述符,而是通過異步 IO 事件喚醒。(epoll_wait)
- 內核僅會將有 IO 事件的文件描述符返回給用戶,用戶也無需遍歷整個文件描述符集合。
epoll僅在Linux系統上支持
2.jdk提供selector
// DefaultSelectorProvider.create方法在不同版本的jdk下有不同實現,創建不同Selector // Windows版本的jdk,其實現中調用的是native的poll方法 public static SelectorProvider create() { return new WindowsSelectorProvider(); } // Linux版本的jdk public static SelectorProvider create() { String str = (String)AccessController.doPrivileged(new GetPropertyAction("os.name")); if (str.equals("SunOS")) { return createProvider("sun.nio.ch.DevPollSelectorProvider"); } if (str.equals("Linux")) { return createProvider("sun.nio.ch.EPollSelectorProvider"); } return new PollSelectorProvider(); }
3.Netty提供的Epoll封裝
netty依然基於epoll做瞭一層封裝,主要做瞭以下事情:
(1)java的nio默認使用水平觸發,Netty的Epoll默認使用邊緣觸發,且可配置
- 邊緣觸發:當狀態變化時才會發生io事件。
- 水平觸發:隻要滿足條件,就觸發一個事件(隻要有數據沒有被獲取,內核就不斷通知你)
(2)Netty的Epoll提供更多的nio的可配參數。
(3)調用c代碼,更少gc,更少synchronized 具體可以參考源碼NioEventLoop.run和EpollEventLoop.run進行對比
4.Netty相關類圖
線程組類圖
channel類圖
5.配置Netty為EpollEventLoop
// 創建指定的EventLoopGroup bossGroup = new EpollEventLoopGroup(1, new DefaultThreadFactory("BOSS_LOOP")); workerGroup = new EpollEventLoopGroup(32, new DefaultThreadFactory("IO_LOOP")); b.group(bossGroup, workerGroup) // 指定channel的class .channel(EpollServerSocketChannel.class) .childHandler(initializer); // 其中channel(clz)方法是通過class來new一個反射ServerSocketChannel創建工廠類 public B channel(Class<? extends C> channelClass) { if (channelClass == null) { throw new NullPointerException("channelClass"); } return channelFactory(new ReflectiveChannelFactory<C>(channelClass)); } final ChannelFuture initAndRegister() { // ... Channel channel = channelFactory.newChannel(); // ... }
三、Netty相關參數
1.SO_KEEPALIVE
childOption(ChannelOption.SO_KEEPALIVE, true)
TCP鏈路探活
2.SO_REUSEADDR
option(ChannelOption.SO_REUSEADDR, true)
重用處於TIME_WAIT但是未完全關閉的socket地址,讓端口釋放後可立即被重用。默認關閉,需要手動開啟
3.TCP_NODELAY
childOption(ChannelOption.TCP_NODELAY, true)
IP報文格式
TCP報文格式
開啟則禁用TCP Negal算法,優點低延時,缺點在大量小數據包的情況下,網絡利用率低
關閉則開啟TCP Negal算法,優點提高網絡利用率(數據緩存到一定量才發送),缺點延時高
Negal算法
- 如果包長度達到MSS(maximum segment size最大分段長度),則允許發送;
- 如果該包含有FIN,則允許發送;
- 設置瞭TCP_NODELAY選項,則允許發送;
- 未設置TCP_CORK選項(是否阻塞不完整報文)時,若所有發出去的小數據包(包長度小於MSS)均被確認,則允許發送;
- 上述條件都未滿足,但發生瞭超時(一般為200ms),則立即發送。
MSS計算規則 MSS的值是在TCP三次握手建立連接的過程中,經通信雙方協商確定的 802.3標準裡,規定瞭一個以太幀的數據部分(Payload)的最大長度是1500個字節(MTU)
MSS = MTU – IP首部 – TCP首部
以太網環境下:
MTU = 1500字節
IP首部 = 32*5/4 = 160bit = 20字節
TCP首部 = 32*5/4 = 160bit = 20字節
最終得出MSS = 1460字節
結論:因為遊戲服務器的實時性要求,在網絡帶寬足夠的情況下,建議開啟TCP_NODELAY,關閉Negal算法,帶寬可以浪費,響應必須及時
註意:需要客戶端服務器均關閉Negal算法,否則仍然會有延遲發送,影響傳輸速度
4.SO_BACKLOG
option(ChannelOption.SO_BACKLOG, 100)
操作系統內核中維護的兩個隊列
- syns queue:保存syn到達,但沒完成三次握手的半連接
cat /proc/sys/net/ipv4/tcp_max_syn_backlog
- accpet queue:保存完成三次握手,內核等待accept調用的連接
cat /proc/sys/net/core/somaxconn
netty對於backlog的默認值設置在NetUtil類253行
SOMAXCONN = AccessController.doPrivileged(new PrivilegedAction<Integer>() { @Override public Integer run() { // 1.設置默認值 int somaxconn = PlatformDependent.isWindows() ? 200 : 128; File file = new File("/proc/sys/net/core/somaxconn"); if (file.exists()) { // 2.文件存在,讀取操作系統配置 in = new BufferedReader(new FileReader(file)); somaxconn = Integer.parseInt(in.readLine()); } else { // 3.文件不存在,從各個參數中讀取 if (SystemPropertyUtil.getBoolean("io.netty.net.somaxconn.trySysctl", false)) { tmp = sysctlGetInt("kern.ipc.somaxconn"); if (tmp == null) { tmp = sysctlGetInt("kern.ipc.soacceptqueue"); if (tmp != null) { somaxconn = tmp; } } else { somaxconn = tmp; } } } } }
結論:
Linux下/proc/sys/net/core/somaxconn一定存在,所以backlog一定取得它的值,我參考prod機器的參數配置的65535,也就是不設置backlog的情況下,服務器運行緩存65535個全連接
5.ALLOCATOR和RCVBUF_ALLOCATOR
默認分配ByteBuffAllocator賦值如下: ByteBufUtil.java
static { //以io.netty.allocator.type為準,沒有的話,安卓平臺用非池化實現,其他用池化實現 String allocType = SystemPropertyUtil.get( "io.netty.allocator.type", PlatformDependent.isAndroid() ? "unpooled" : "pooled"); allocType = allocType.toLowerCase(Locale.US).trim(); ByteBufAllocator alloc; if ("unpooled".equals(allocType)) { alloc = UnpooledByteBufAllocator.DEFAULT; logger.debug("-Dio.netty.allocator.type: {}", allocType); } else if ("pooled".equals(allocType)) { alloc = PooledByteBufAllocator.DEFAULT; logger.debug("-Dio.netty.allocator.type: {}", allocType); } else { //io.netty.allocator.type設置的不是"unpooled"或者"pooled",就用池化實現。 alloc = PooledByteBufAllocator.DEFAULT; logger.debug("-Dio.netty.allocator.type: pooled (unknown: {})", allocType); } DEFAULT_ALLOCATOR = alloc; }
RCVBUF_ALLOCATOR默認AdaptiveRecvByteBufAllocator
public class DefaultChannelConfig implements ChannelConfig { // ... public DefaultChannelConfig(Channel channel) { this(channel, new AdaptiveRecvByteBufAllocator()); } // ... }
四、Netty關閉
/** * Shortcut method for {@link #shutdownGracefully(long, long, TimeUnit)} with sensible default values. * * @return the {@link #terminationFuture()} */ Future<?> shutdownGracefully(); /** * Signals this executor that the caller wants the executor to be shut down. Once this method is called, * {@link #isShuttingDown()} starts to return {@code true}, and the executor prepares to shut itself down. * Unlike {@link #shutdown()}, graceful shutdown ensures that no tasks are submitted for <i>'the quiet period'</i> * (usually a couple seconds) before it shuts itself down. If a task is submitted during the quiet period, * it is guaranteed to be accepted and the quiet period will start over. * * @param quietPeriod the quiet period as described in the documentation 靜默期:在此期間,仍然可以提交任務 * @param timeout the maximum amount of time to wait until the executor is {@linkplain #shutdown()} * regardless if a task was submitted during the quiet period 超時時間:等待所有任務執行完的最大時間 * @param unit the unit of {@code quietPeriod} and {@code timeout} * * @return the {@link #terminationFuture()} */ Future<?> shutdownGracefully(long quietPeriod, long timeout, TimeUnit unit); // 抽象類中的實現 static final long DEFAULT_SHUTDOWN_QUIET_PERIOD = 2; static final long DEFAULT_SHUTDOWN_TIMEOUT = 15; @Override public Future<?> shutdownGracefully() { return shutdownGracefully(DEFAULT_SHUTDOWN_QUIET_PERIOD, DEFAULT_SHUTDOWN_TIMEOUT, TimeUnit.SECONDS); }
- 把NIO線程的狀態位設置成ST_SHUTTING_DOWN狀態,不再處理新的消息(不允許再對外發送消息);
- 退出前的預處理操作:把發送隊列中尚未發送或者正在發送的消息發送完、把已經到期或者在退出超時之前到期的定時任務執行完成、把用戶註冊到NIO線程的退出Hook任務執行完成;
- 資源的釋放操作:所有Channel的釋放、多路復用器的去註冊和關閉、所有隊列和定時任務的清空取消,最後是NIO線程的退出。
以上就是遊戲服務器中的Netty應用以及源碼剖析的詳細內容,更多關於Netty遊戲服務器的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- 在netty中使用native傳輸協議的方法
- Java遊戲服務器系列之Netty相關知識總結
- 在SpringBoot中,如何使用Netty實現遠程調用方法總結
- Netty結合Protobuf進行編解碼的方法
- Springboot中用 Netty 開啟UDP服務方式