![搜狐2022C++工程師面試題(應(yīng)聘求職面試準(zhǔn)備資料)_第1頁](http://file4.renrendoc.com/view/e5d494fc22ab18ec3568865797dba2e7/e5d494fc22ab18ec3568865797dba2e71.gif)
![搜狐2022C++工程師面試題(應(yīng)聘求職面試準(zhǔn)備資料)_第2頁](http://file4.renrendoc.com/view/e5d494fc22ab18ec3568865797dba2e7/e5d494fc22ab18ec3568865797dba2e72.gif)
![搜狐2022C++工程師面試題(應(yīng)聘求職面試準(zhǔn)備資料)_第3頁](http://file4.renrendoc.com/view/e5d494fc22ab18ec3568865797dba2e7/e5d494fc22ab18ec3568865797dba2e73.gif)
![搜狐2022C++工程師面試題(應(yīng)聘求職面試準(zhǔn)備資料)_第4頁](http://file4.renrendoc.com/view/e5d494fc22ab18ec3568865797dba2e7/e5d494fc22ab18ec3568865797dba2e74.gif)
![搜狐2022C++工程師面試題(應(yīng)聘求職面試準(zhǔn)備資料)_第5頁](http://file4.renrendoc.com/view/e5d494fc22ab18ec3568865797dba2e7/e5d494fc22ab18ec3568865797dba2e75.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
搜狐2022C++工程師面試題第1題:一、單選題1、假設(shè)整數(shù)0x12345678存放在內(nèi)存地址0x0開頭的連續(xù)四個(gè)字節(jié)中(即地址0x0到0x3),那么在以LittleEndian字節(jié)序存儲的memory中,地址0x3的地方存放的字節(jié)是:0x120x340x560x781、ALittle-Endian就是低位字節(jié)排放在內(nèi)存的低地址端,高位字節(jié)排放在內(nèi)存的高地址端。Big-Endian就是高位字節(jié)排放在內(nèi)存的低地址端,低位字節(jié)排放在內(nèi)存的高地址端。c)網(wǎng)絡(luò)字節(jié)序:TCP/IP各層協(xié)議將字節(jié)序定義為Big-Endian,因此TCP/IP協(xié)議中使用的字節(jié)序通常稱之為網(wǎng)絡(luò)字節(jié)序。假如是Little-Endian:0x0-0x3內(nèi)存分別存放的是:0x78、0x56、0x34、0x12;假如是Big-Endian:0x0-0x3內(nèi)存分別存放的是:0x12、0x34、0x56、0x78;第2題:2、以下代碼輸出的是_?intfoofintx,inty)(if(x=0||y=0)return1;return3*foo(x-l,y/2);}coutfoo(3,5)endl;A、81B、27C、9D、32、B遞歸:3*3*3*f(0,0)=3*3*3*1=27。第3題:3、給定下列程序,那么執(zhí)行printf("%\n",foo(20,13));的輸出結(jié)果是多少?intfoo(intx,inty)(if(x<=0||y<=0)return1;return3*foo(x-6,y/2);)A、3B、9C、27D、813、D第4題:4、假如x=2022,下面函數(shù)的返回值是()intfun(unsignedintx)intn=0;while((x+l))n++;x=x|(x+l);}returnn;}A、20B、21C、23D、254、C返回值為:232022對應(yīng)的二進(jìn)制為:0000000000000000000011111011110而x|(x+1)的作用是對一個(gè)數(shù)中二進(jìn)制。的個(gè)數(shù)進(jìn)行統(tǒng)計(jì)例如本題:第一次循環(huán):0000000000000000000011111011110|0000000000000000000011111011110=0000000000000000000011111011111其次次循環(huán):000000000000000000001111101111110000000000000000000011111100000=0000000000000000000011111111111每循環(huán)一次0的數(shù)量減一,直到溢出所以2022二進(jìn)制中一共有23個(gè)0則返回值為23第5題:5、以下代碼的輸出是()inta[5]={l,2,3A5};int*ptr=(int*)(a+l);printf("%d,%d"/*(a+l),*(ptr-l));A、1,2B、2,5C、2,1D、1,55、Ba代表的是int*每次步長為一個(gè)inta代表的是int[]*每次步長為所指向的數(shù)組的大小故ptr指向的是數(shù)組a最終一個(gè)元素的下一個(gè)元素所以ptr-1指向的是數(shù)組a的最終一個(gè)元素a+1指向的是數(shù)組a的其次個(gè)元素所以正確答案是B第6題:6、在linux下64位c程序,請計(jì)算輸出的三個(gè)sizeof分別是()voidfunc(charstr_arg[100])(coutsizeof(str_arg)endl;}intmain(intargc,char*argv[]){charstr[]="Hello";char*p=str;coutsizeof(str)endl;coutsizeof(p)endl;func("test");return0;}5,5,86,6,46,8,4D^6,8,86、D這里主要是區(qū)分sizeof運(yùn)算符的測量對象sizeof(str)測量的是字符數(shù)組的占用長度,留意字符串后還有個(gè)\0,所以是6sizeof(p)測量的是指針的占用長度,64位系統(tǒng)下是8字節(jié)sizeof(str_arg)測量的是指針長度,由于這里是形參。第7題:7、下面關(guān)于迭代器失效的描述哪個(gè)是錯誤的()A、vector的插入操作不會導(dǎo)致迭代器失效B、map的插入操作不會導(dǎo)致迭代器失效C、vector的刪除操作只會導(dǎo)致指向被刪除元素及后面的迭代器失D、map的刪除操作只會導(dǎo)致指向被刪除元素的迭代器失效7、A由于由Vector的iterator和listiterator方法所返回的迭代器是快速失敗的:假如在迭代器創(chuàng)建后的任意時(shí)間從結(jié)構(gòu)上修改了向量(通過迭代器自身的remove或add方法之外的任何其他方式),則迭代器將拋出ConcurrentModificationExceptiono第8題:8、函數(shù)fun的聲明為intfun(int*p[4]),以下哪個(gè)變量可以作為fun的合法參數(shù)()A、inta⑷[4];B、int**a;C、int**a[4]D>int(*a)[4];8、B可以看出fun函數(shù)的形參是一個(gè)指針數(shù)組,也就是指針指向一個(gè)地址,地址中存放的內(nèi)容也是指針。A,二維數(shù)組,不符合B,二級指針,也就是指針指向的內(nèi)容也還是存放指針的,符合C,二級指針數(shù)組,數(shù)組的內(nèi)容是二級指針,不符合D,數(shù)組指針,不符合第9題:9、下面說法正確的是()A、C++已有的任何運(yùn)算符都可以重載B、const對象只能調(diào)用const類型成員函數(shù)C、構(gòu)造函數(shù)和析構(gòu)函數(shù)都可以是虛函數(shù)D、函數(shù)重載返回值類型必需相同9、BA不能重載?,由于,在類中對任何成員都有意義,已經(jīng)成為標(biāo)準(zhǔn)用法。不能重載?:,由于這個(gè)運(yùn)算符對于類對象來說沒有實(shí)際意義,相反還會引起歧義還有::C構(gòu)造函數(shù)不能是虛函數(shù)。D函數(shù)重載只跟參數(shù)類型和參數(shù)個(gè)數(shù)有關(guān)。第10題:10、典型的創(chuàng)建Windows窗口過程的流程為()A、注冊窗口類-創(chuàng)建窗口-顯示窗口-更新窗口-消息循環(huán)B、注冊窗口類-創(chuàng)建窗口-更新窗口-顯示窗口-消息循環(huán)C、創(chuàng)建窗口-注冊窗口類-更新窗口-顯示窗口-消息循環(huán)D、創(chuàng)建窗口-注冊窗口類-顯示窗口-更新窗口-消息循環(huán)10、A在屏幕上顯示一個(gè)窗口的過程一般有以下步驟,這就是主程序的結(jié)構(gòu)流程:(1)得到應(yīng)用程序的句柄(GetModuleHandle)o(2)注冊窗口類(RegisterClassEx)。在注冊之前,要先填寫RegisterClassEx的參數(shù)WNDCLASSEX結(jié)構(gòu)。(3)建立窗口(CreateWindowEx)。(4)顯示窗口(ShowWindows)o(5)刷新窗口客戶區(qū)(UpdateWindow)。(6)進(jìn)入無限的消息獵取和處理的循環(huán)。首先獵取消息(GetMessage),假如有消息到達(dá),則將消息分派到回調(diào)函數(shù)處理(DispatchMessage),假如消息是WM_QUIT,則退出循環(huán)。第11題:11、下面哪個(gè)API返回的不屬于windows內(nèi)核對象()A、CreateFileB、CreateSemaphoreC、CreateDCD、eateEvent11、CABD選項(xiàng)是內(nèi)核對象:大事對象HANDLECreateEvent。;文件對象HANDLECreateFile。;信號量對象HANDLECreateSemaphore();C選項(xiàng)是GDI對象。設(shè)備上下文(HDC)CreateDC第12題:12、用戶雙擊鼠標(biāo)時(shí)產(chǎn)生的消息序列,下面正確的是()A、WM_LBUTTONDOWN,WM_LBUTTONUP,WM_LBUTTONDOWN,WM_LBUTTONUPB、WM_LBUTTONDOWN,WM_LBUTTONUP,WM_LBUTTONUP,WM_LBUTTONDBLCLKC>WM_LBUTTONDOWN,WM_LBUTTONUP,WM_LBUTTONDOWN,WMLBUTTONDBLCLKD>WM_LBUTTONDOWN,WM_LBUTTONUP,WM_LBUTTONDBLCLK,WM_LBUTTONUP12、D雙擊即點(diǎn)擊左鍵兩下,第一次觸發(fā)LBUTTONDOWN和LBUTTONUP,其次次點(diǎn)擊時(shí)觸發(fā)雙擊大事LBUTTONDBLCLK(doubleclick),放掉再觸發(fā)LBUTTONUP第13題:13、以下關(guān)于線程以下描述正確的是().windows線程創(chuàng)建時(shí),默認(rèn)綁定在1個(gè)特定的CPU上.可采納SetThreadAffinityMask接口設(shè)置線程與某個(gè)cpu綁定._beginthreadex比CreateThread創(chuàng)建線程平安是由于使用_beginthreadex會創(chuàng)建一個(gè)_tiddata,在調(diào)用一些諸如strtok函數(shù)時(shí)會將需要愛護(hù)的數(shù)據(jù)存入_tiddata.使用—beginthread創(chuàng)建線程時(shí),線程執(zhí)行函數(shù)必需為_cdecl約束規(guī)范,而_beginthreadex指定的線程執(zhí)行函數(shù)必需為_stdcallA、1,2B、1,3C、1D、以上都不正確13、D解釋:1:不正確。windows線程創(chuàng)建時(shí),不會綁定在特定的CPU上,需要手動綁定,或者調(diào)用SetThreadAffinityMask接口進(jìn)行綁定;2 : 正確。參考/beyond_cn/article/details/158133613:不正確。參考2的鏈接。歡迎各位訂正。4:正確。參考msdn:_beginthread函數(shù)可創(chuàng)建在start_address開頭執(zhí)行例程的線程。start_address中的例程必需使用 _cdecl (用于本機(jī)代碼)或_clrcall (用于托管代碼)調(diào)用商定,并且應(yīng)沒有返回值。傳遞給_beginthreadex的start_address 中的例程必需使用 _stdcall(用于本機(jī)代碼)或_clrcall(用于托管代碼)調(diào)用商定,并且必需返回線程退出代碼。所以,通過1,就能選出D。第14題:14、以下哪些線程同步鎖可以為遞歸鎖.信號量2.讀寫鎖3.互斥量4.大事5.臨界區(qū)(CriticalSection)1,3,4,5B、5C、3,5D、1,3,514、C進(jìn)程/線程同步方法常見的進(jìn)程/線程同步方法有互斥鎖(或稱互斥量Mutex)、讀寫鎖(rdlock)、條件變量(cond)>信號量(Semophore)等。在windows系統(tǒng)中,臨界區(qū)(CriticalSection)和大事對象(Event)也是常用的同步方法。遞歸鎖/非遞歸鎖Mutex可以分為遞歸鎖(recursivemutex)和非遞歸鎖(non-recursivemutex)o遞歸鎖也叫可重入鎖(reentrantmutex),非遞歸鎖也叫不行重入鎖(non-reentrantmutex)o二者唯一的區(qū)分是:同一個(gè)線程可以多次獵取同一個(gè)遞歸鎖,不會產(chǎn)生死鎖。假如一個(gè)線程多次獵取同一個(gè)非遞歸鎖,則會產(chǎn)生死鎖。Windows下的Mutex和CriticalSection是可遞歸的。Linux下的pthread_mutex_t鎖是默認(rèn)是非遞歸的??梢酝ㄟ^設(shè)置PTHREAD_MUTEX_RECURSIVE屬性,將pthread_mutex_t鎖設(shè)置為遞歸鎖。第15題:15^關(guān)于sendmessage和postmessage的區(qū)分,下面的說法錯誤的是()A、postmessage發(fā)出消息后,將消息放到消息隊(duì)列中,立刻返回B、sendmessage發(fā)出消息后,始終等到該消息執(zhí)行完畢,才返回C、用sendmessage給其他線程創(chuàng)建的窗口發(fā)送消息時(shí),消息也會進(jìn)消息隊(duì)列D、用2個(gè)函數(shù)只能給當(dāng)前進(jìn)程的窗口發(fā)送消息15、DA:PostMessage只把消息放入隊(duì)列,不管其他程序是否處理都返回,然后連續(xù)執(zhí)行,這是個(gè)異步消息投放函數(shù)。B:SendMessage必需等待其他程序處理消息完了之后才返回,連續(xù)執(zhí)行,這是個(gè)同步消息投放函數(shù)。C:當(dāng)某線程調(diào)用sendmessage給別的線程創(chuàng)建的窗口時(shí),發(fā)送的消息首先追加到接收線程的發(fā)送消息隊(duì)列,發(fā)送線程處于空閑狀態(tài),等待接收線程處理完他的消息返回給發(fā)送線程的應(yīng)答隊(duì)列,等到后發(fā)送線程被喚醒取得應(yīng)答隊(duì)列的消息(就是處理完消息的返回值),連續(xù)執(zhí)行。D:sendmessage和postmessage都可以給其他線程發(fā)送消息第16題:16、關(guān)于WM_COPYDATA消息的處理,下面描述錯誤的是()A、可以在不同進(jìn)程之間傳遞少量只讀數(shù)據(jù)B、只能通過sendmessage方式來發(fā)送該消息C、只能在窗口過程函數(shù)中處理該消息D、可以在消息隊(duì)列或窗口過程函數(shù)中處理該消息16、CA:WM_COPYDATA消息的主要目的是允許在進(jìn)程間傳遞只讀數(shù)據(jù)。Windows在通過WM_COPYDATA消息傳遞期間,不供應(yīng)繼承同步方式。B;該消息只能由SendMessage。來發(fā)送,而不能使用PostMessage()o由于系統(tǒng)必需管理用以傳遞數(shù)據(jù)的緩沖區(qū)的生命期,假如使用了PostMessage(),數(shù)據(jù)緩沖區(qū)會在接收方(線程)有機(jī)會處理該數(shù)據(jù)之前,就被系統(tǒng)清除和回收。D:可以在消息隊(duì)列或窗口過程函數(shù)中處理該消息第17題:17、常用的windows進(jìn)入點(diǎn)函數(shù)wWinMain共有四個(gè)參數(shù),其中不包括以下哪種類型的參數(shù)()A^intchar*C、PWSTRD、HINSTANCE17、CWinMain函數(shù)的原型聲明如下:intWINAPIWinMain(HINSTANCEhlnstance,//handletocurrentinstanceHINSTANCEhPrevInstance,//handletopreviousinstanceLPSTRIpCmdLine,//commandlineintnCmdShow//showstate);第一個(gè)參數(shù)hlnstance表示該程序當(dāng)前運(yùn)行的實(shí)例的句柄,這是一個(gè)數(shù)值。其次個(gè)參數(shù)hPrevInstance表示當(dāng)前實(shí)例的前一個(gè)實(shí)例的句柄。第三個(gè)參數(shù)IpCmdLine是一個(gè)以空終止的字符串,指定傳遞給應(yīng)用程序的命令行參數(shù)。第四個(gè)參數(shù)nCmdShow指定程序的窗口應(yīng)當(dāng)如何顯示,例如最大化、最小化、隱蔽等。第18題:18、下列windows消息中,優(yōu)先級相對較低的是哪一個(gè)()A、WM_MOUSEMOVEB^WM_TIMERC、WM_CHARD、WM_WINDOWPOSCHANGED18、BWM_TIMER消息的優(yōu)先級最低,所以在有其他消息的狀況下,WM_TIMER消息得不處處理A:WM_MOUSEMOVE消息在鼠標(biāo)移動時(shí)被發(fā)送至已獲焦點(diǎn)的窗口B:Windows定時(shí)器是一種周期性的消息產(chǎn)生裝置,它會每隔一段指定時(shí)間發(fā)送一次定時(shí)消息WM_TIMEROC:未經(jīng)輸入法而直接送人程序中的字符會響應(yīng)WM_CHAR消息D:發(fā)送此消息給那個(gè)窗口的大小和位置已經(jīng)被轉(zhuǎn)變時(shí),來調(diào)用setwindowpos函數(shù)或其它窗口管理函數(shù)第19題:19、最小堆[0,3,2,5,7,4,6,8],在刪除堆頂元素0之后,其結(jié)果是()TOC\o"1-5"\h\zA、[3, 2, 5, 7, 4, 6, 8]B、[2, 3, 5, 7, 4, 6, 8]C、[2, 3, 4, 5, 7, 8, 6]D、[2, 3, 4, 5, 6, 7, 8]19、C依據(jù)堆的刪除規(guī)章,刪除操作只能在堆頂進(jìn)行,也就是刪除0元素。然后讓最終一個(gè)節(jié)點(diǎn)放在堆頂,做向下調(diào)整工作,讓剩下的數(shù)組依舊滿意最小堆。刪除0后用8填充0的位置,為[8,3,2,5,7,4,6]然后8和其子節(jié)點(diǎn)3,2比較,結(jié)果2最小,將2和8交換,為:[2,3,8,57,4,6]然后8的下標(biāo)為2,其兩個(gè)孩子節(jié)點(diǎn)下標(biāo)分別為2*2+1=5,2*2+2=6也就是4和6兩個(gè)元素,經(jīng)比較,4最小,將8與4交換,為[2,3,4,578,6]這時(shí)候8已經(jīng)沒有孩子節(jié)點(diǎn)了,調(diào)整完成。第20題:20、對一個(gè)由A,B,C,D隨機(jī)組成的序列進(jìn)行哈弗曼編碼,據(jù)統(tǒng)計(jì),各個(gè)元素的概率分別為:P(A)=0.4,P(B)=0.35,P(C)=0.2,P(D)=0.05,請問該編碼的平均期望編碼長度為()bits?A、1.45B、1.7C、1.85D、1.9220、C首先要建立哈夫曼樹,然后計(jì)算平均期望編碼長度:0.4*1+0.35*2+0.2*3+0.05*3=1.85第21題:21、設(shè)有遞歸算法如下,intx(intn)(if(n=3)return1;elsereturnx(n-2)+x(n-4)+l;)試問計(jì)算x(x(8))時(shí)需要計(jì)算()次x函數(shù)。A、8B、9C、16D、1821、Dx(8)=x(6)+x(4)+l遞歸計(jì)算X⑻第一次調(diào)用x(6)=x(4)+x(2)+l遞歸計(jì)算x⑹其次次調(diào)用x(4)=x(2)+x(0)+l遞歸計(jì)算x(4)第三次調(diào)用x(4)=x(2)+x(0)+l遞歸計(jì)算x(4)第四次調(diào)用之后再調(diào)用x()計(jì)算黑體部分的結(jié)果(5次,加上前面4次,一共9次),最終x(8)返回值為9接著計(jì)算x(9)x(9)=x(7)+x(5)+l遞歸計(jì),算x(9)第一次調(diào)用x(7)=x(5)+x(3)+l遞歸計(jì)算x(7)其次次調(diào)用x(5)=x(3)+x(l)+l遞歸計(jì)算x(5)第三次調(diào)用x(5)=x(3)+x(l)+l遞歸計(jì)算x(5)第四次調(diào)用之后再調(diào)用x()計(jì)算黑體部分的結(jié)果(5次,加上前面4次,一共9次),最終x(8)返回值為9所以總共調(diào)用x()的次數(shù)是9+9=18第22題:22、設(shè)一組初始記錄關(guān)鍵字序列9出工,丫尸內(nèi)1\/15無口下兇,則按字母升序的第一趟冒泡排序結(jié)束后的結(jié)果是()TOC\o"1-5"\h\zA、F, H, C, D, P, A, M, Q, R, S, Y, XB、P, A, C, S, Q, D, F,X, R, H, M, YC、A, D, C, R, F, Q, M, S, Y, P, H, XD、H, C, Q, P, A, M,S, R, D, F, X, Y22、D第一趟冒泡:從數(shù)組第一個(gè)元素到最終一個(gè)元素掃描,比較相鄰的元素,假如后一個(gè)元素小于前一個(gè),則交換位置。第一趟結(jié)束時(shí),最大元素到達(dá)最終一個(gè)元素位置第23題:23、堆排序的空間簡單度是(),堆排序中構(gòu)建堆的時(shí)間簡單度是A、0(logn),O(n)B、O(logn),O(nlogn)0(1),0(n)D^0(1),O(nlogn)23、C"空間簡單度”指占內(nèi)存大小,堆排序每次只對一個(gè)元素操作,是就地排序,所用幫助空間0(1),空間簡單度是0(1)在構(gòu)建堆的過程中,完全二叉樹從最下層最右邊的非終端結(jié)點(diǎn)開頭構(gòu)建,將它與其孩子進(jìn)行比較和必要的互換,對于每個(gè)非終端結(jié)點(diǎn)來說,其實(shí)最多進(jìn)行兩次比較和互換操作,因此整個(gè)構(gòu)建堆的時(shí)間簡單度為0(n)o在正式排序時(shí),第i次取堆頂記錄重建堆需要用O(logi)的時(shí)間(完全二叉樹的某個(gè)結(jié)點(diǎn)到根結(jié)點(diǎn)的距離為?Iog2i?+1),并且需要取n-1次堆頂記錄,因此,重建堆的時(shí)間簡單度為O(nlogn)。第24題:24、若用一個(gè)大小為6的數(shù)組來實(shí)現(xiàn)循環(huán)隊(duì)列,且當(dāng)前rear和front的值分別0和30當(dāng)從隊(duì)列中刪除一個(gè)元素,再加入兩個(gè)元素后,rear
和front的值分別為()A、2和4B、1和5C、4和2D、5和124、A由于出隊(duì)時(shí),front=front+l/MAXSIZE,rear不變,所以front=4入隊(duì)時(shí),rear=rear+l/MAXSIZE,front不變,所以rear=2;第25題:25、如下表是用戶是否使用某產(chǎn)品的調(diào)查結(jié)果()UID年齡地區(qū)學(xué)歷UID年齡地區(qū)學(xué)歷收入用戶是否使用調(diào)查產(chǎn)品1低北方博士低是2高北方本科中否3低南方本科高否4高北方討論生中是請計(jì)算年齡,地區(qū),學(xué)歷,收入中對用戶是否使用調(diào)查產(chǎn)品信息增益最大的屬性(Log23=0.63)A、年齡B、地區(qū)C、學(xué)歷D、收入25、C不用算一眼就能看出來,全部本科學(xué)歷都不使用調(diào)查產(chǎn)品,全部非本科學(xué)歷都使用了調(diào)查產(chǎn)品。這種可以確定的劃分導(dǎo)致信息嫡為0,信息增益最大第26題:26、假設(shè)某算法的計(jì)算時(shí)間可用遞推關(guān)系式T(n)=2T(n/2)+n表示,則該算法的時(shí)間簡單度為()A、O(logn)B、O(n*logn)C、0(n)D、0(nA2)26、BT(n)=2Ak*(T(n/(2Ak)))+k*n2"=n,k=log(n)(以2為底)T(n)=n*T(l)+n*log(n)=c*n*log(n)(c為常數(shù))所以是O(n*logn)第27題:27、基于統(tǒng)計(jì)的分詞方法為()A、正向最大匹配法B、逆向最大匹配法C、最少切分D、條件隨機(jī)場27、D目前的分詞方法歸納起來有3類:第一類是基于語法和規(guī)章的分詞法。其基本思想就是在分詞的同時(shí)進(jìn)行句法、語義分析,利用句法信息和語義信息來進(jìn)行詞性標(biāo)注,以解決分詞歧義現(xiàn)象。由于現(xiàn)有的語法學(xué)問、句法規(guī)章非?;\統(tǒng)、簡單,基于語法和規(guī)章的分詞法所能達(dá)到的精確度遠(yuǎn)遠(yuǎn)還不能令人滿足,目前這種分詞系統(tǒng)還處在試驗(yàn)階段。其次類是機(jī)械式分詞法(即基于詞典)。機(jī)械分詞的原理是將文檔中的字符串與詞典中的詞條進(jìn)行逐一匹配,假如詞典中找到某個(gè)字符串,則匹配勝利,可以切分,否則不予切分?;谠~典的機(jī)械分詞法,實(shí)現(xiàn)簡潔,有用性強(qiáng),但機(jī)械分詞法的最大的缺點(diǎn)就是詞典的完備性不能得到保證。據(jù)統(tǒng)計(jì),用一個(gè)含有70000個(gè)詞的詞典去切分含有15000個(gè)詞的語料庫,仍舊有30%以上的詞條沒有被分出來,也就是說有4500個(gè)詞沒有在詞典中登錄。第三類是基于統(tǒng)計(jì)的方法?;诮y(tǒng)計(jì)的分詞法的基本原理是依據(jù)字符串在語料庫中消失的統(tǒng)計(jì)頻率來打算其是否構(gòu)成詞。詞是字的組合,相鄰的字同時(shí)消失的次數(shù)越多,就越有可能構(gòu)成一個(gè)詞。因此字與字相鄰共現(xiàn)的頻率或概率能夠較好的反映它們成為詞的可信度。最大匹配是指以詞典為依據(jù),取詞典中最長單詞為第一個(gè)次取字?jǐn)?shù)量的掃描串,在詞典中進(jìn)行掃描,這是基于詞典分詞的方法.正向最大匹配法.逆向最大匹配法.最少切分法:使每一句中切出的詞數(shù)最小,這也是基于詞典分詞的方法條件隨機(jī)場是一個(gè)基于統(tǒng)計(jì)的序列標(biāo)記和分割的方法,屬于基于統(tǒng)計(jì)的分詞方法范疇。它定義了整個(gè)標(biāo)簽序列的聯(lián)合概率,各狀態(tài)是非**的,彼此之間可以交互,因此可以更好地模擬現(xiàn)實(shí)世界的數(shù)據(jù).第28題:28、下列哪個(gè)不屬于CRF模型對于HMM和MEMM模型的優(yōu)勢()A、特征敏捷B、速度快C、可容納較多上下文信息D、全局最優(yōu)28、B隱馬爾可夫模型(HiddenMarkovModel,HMM),最大熠馬爾可夫模型(MaximumEntropyMarkovModel,MEMM)以及條件隨機(jī)場(ConditionalRandomField,CRF)是序列標(biāo)注中最常用也是最基本的三個(gè)模型。HMM模型是對轉(zhuǎn)移概率和表現(xiàn)概率直接建模,統(tǒng)計(jì)共現(xiàn)概率。MEMM模型是對轉(zhuǎn)移概率和表現(xiàn)概率建立聯(lián)合概率,統(tǒng)計(jì)時(shí)統(tǒng)計(jì)的是條件概率,但MEMM簡單陷入局部最優(yōu),是由于MEMM只在局部做歸一化。RF模型中,統(tǒng)計(jì)了全局概率,在做歸一化時(shí),考慮了數(shù)據(jù)在全局的分布,而不是僅僅在局部歸一化,這樣就解決了MEMM中的標(biāo)記偏置(labelbias)的問題。CRF沒有HMM那樣嚴(yán)格的**性假設(shè)條件,因而可以容納任意的上下文信息。特征設(shè)計(jì)敏捷。(與ME一樣) 與HMM比較同時(shí),由于CRF計(jì)算全局最優(yōu)輸出節(jié)點(diǎn)的條件概率,它還克服了最大燧馬爾可夫模型標(biāo)記偏置(Label-bias)的缺點(diǎn)。shy;shy; 與MEMM比較CRF是在給定需要標(biāo)記的觀看序列的條件下,計(jì)算整個(gè)標(biāo)記序列的聯(lián)合概率分布,而不是在給定當(dāng)前狀態(tài)條件下,定義下一個(gè)狀態(tài)的狀態(tài)分布。CRF需要訓(xùn)練的參數(shù)更多,與MEMM和HMM相比,它存在訓(xùn)練代價(jià)大、簡單度高的缺點(diǎn)。第29題:29、假設(shè)一個(gè)完整的撲克牌有52張牌,2黑色(黑葵和梅花)和2紅色(方塊和紅心)。假如給你一副完整的牌,和半副牌(1紅色和1黑色),則兩種狀況下抽兩種牌都是紅色的概率是多少()A、1/2,1/225/102,12/5050/51,24/2525/51,12/2529、B第一種狀況26/52*25/51=25/102其次種狀況13/26*12/25=12/50第30題:30、在二分類問題中,當(dāng)測試集的正例和負(fù)例數(shù)量不均衡時(shí),以下評價(jià)方案哪個(gè)是相對不合理的()(假設(shè)precision=TP/(TP+FP),recall=TP/(TP+FN)o)A、Accuracy:(TP+TN)/allB、F-value:2*recall*precision/(recall+precision)C、G-mean:sqrt(precision*recall)D、AUC:曲線下面積30、A題目提到測試集正例和負(fù)例數(shù)量不均衡,那么假設(shè)正例數(shù)量很少占10%,負(fù)例數(shù)量
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年代理記帳合同商范文(2篇)
- 2025年產(chǎn)品承包經(jīng)營合同(2篇)
- 2025年個(gè)人門面店鋪轉(zhuǎn)讓協(xié)議范文(2篇)
- 民宿裝修合同專業(yè)文檔
- 親子樂園裝修合同模板
- 國際藝術(shù)品收藏居間協(xié)議
- 家電公司辦公室翻新協(xié)議
- 養(yǎng)殖技術(shù)升級飼料配送協(xié)議
- 客運(yùn)站裝修改造協(xié)議
- 塑料原料運(yùn)輸服務(wù)合同
- 2025新譯林版英語七年級下單詞表
- 海洋工程設(shè)備保溫保冷方案
- 文藝演出排練指導(dǎo)服務(wù)合同
- 醫(yī)院消防安全培訓(xùn)課件(完美版)
- 人教版(2024新版)一年級上冊數(shù)學(xué)第一單元《數(shù)學(xué)游戲》單元整體教學(xué)設(shè)計(jì)
- 魏寧海超買超賣指標(biāo)公式
- 防洪防汛安全知識教育課件
- (正式版)FZ∕T 80014-2024 潔凈室服裝 通 用技術(shù)規(guī)范
- 新起點(diǎn)英語二年級下冊全冊教案
- 【幼兒園戶外體育活動材料投放的現(xiàn)狀調(diào)查報(bào)告(定量論文)8700字】
- 剪映專業(yè)版:PC端短視頻制作(全彩慕課版) 課件 第3章 短視頻剪輯快速入門
評論
0/150
提交評論