時間:2022-11-18 14:15:13
序論:好文章的創(chuàng)作是一個不斷探索和完善的過程,我們?yōu)槟扑]十篇購房意向書范例,希望它們能助您一臂之力,提升您的閱讀品質(zhì),帶來更深刻的閱讀感受。
姓名:________ 身份證號:________ 住址:________ 聯(lián)系電話:________
買方(以下簡稱乙方):
姓名:________ 身份證號:________ 住址:________ 聯(lián)系電話:________
第一條 甲方房屋坐落于;房屋建筑面積平方米(其中套內(nèi)建筑面積______平方米);房屋用途為;該房屋附屬物_____面積平方米。
第二條 該房屋(包括附屬物)總價款為人民幣元整。
第三條該房屋為濟南鐵路局職工房改房,房屋產(chǎn)權(quán)證尚未正式辦理下來,甲方保證在交易時該房屋產(chǎn)權(quán)明晰沒有產(chǎn)權(quán)糾紛。有關(guān)抵押債務、稅項及物業(yè)水電費等,甲方均在交易前辦妥。交易后如有上述未清事項,由甲方承擔全部責任。
第四條 甲方負責該房屋產(chǎn)權(quán)證辦理手續(xù)并承擔相關(guān)的辦理費用,該房屋的面積如有變動,以房管部門測繪后新出測繪圖所載為準。
第五條 甲乙雙方以誠意負責的態(tài)度進行該房屋的產(chǎn)權(quán)交易事宜,并為規(guī)避交易風險,就交易步驟作如下約定。
第一步、甲乙雙方約定時間到對該房屋現(xiàn)場查看并由甲方就該房屋實際狀況向乙方說明。
第二步、甲乙雙方約定時間到房管部門確認該房屋的產(chǎn)權(quán)及相關(guān)情況,并在確認后,由乙方向甲方支付定金人民幣元整,同時甲乙雙方簽訂本意向書。
第三步、甲方應在收取定金后,于年月日之前辦理完結(jié)該房屋的房屋產(chǎn)權(quán)證。
第四步、甲方在房屋產(chǎn)權(quán)證辦理完結(jié)后到所轄派出所辦理戶口遷出手續(xù)并知會乙方。然后,甲乙雙方約定時間辦理網(wǎng)簽和過戶手續(xù),同時乙方向甲方支付人民幣元整先行款。
第五步、甲方應于收到乙方先行款后日內(nèi)向乙方交房,乙方在收房查驗后將尾款人民幣元整支付給甲方。
第六條 因本房屋所有權(quán)轉(zhuǎn)移所發(fā)生的契稅等稅費由甲乙雙方各自依法向國家交納,其他費用,依據(jù)政府規(guī)定各自承擔。
第七條 如需通過中介機構(gòu)辦理房屋買賣事宜,中介費用由乙方負擔。
第八條 本意向書簽訂后,如乙方提出不購買該房屋,乙方已支付定金甲方不予退還。如甲方提出不出售該房屋給乙方,應在提出之日后5個工作日內(nèi)返還給乙方雙倍定金。
第九條 本意向書內(nèi),空格部分填寫的文字與印刷文字具有同等效力。本意向書中未規(guī)定的事項,均遵照中華人民共和國有關(guān)法律、法規(guī)和政策執(zhí)行。
第十條 本意向書在履行中發(fā)生爭議,由甲、乙雙方協(xié)商解決。
第十一條 本意向書經(jīng)甲、乙雙方簽字之日起生效。
第十二條 本意向書共2頁,一式二份,甲、乙雙方各執(zhí)一份,均具有同等效力。
甲方(簽章):_______
乙方(簽章):________
______年______月______日
______年______月______日
購房意向書范文2購房意向書
賣方(以下簡稱甲方):姓名: 身份證號:
住址:
聯(lián)系電話: 買方(以下簡稱乙方):姓名: 身份證號:
住址:
聯(lián)系電話:
第一條 甲方房屋坐落于 ;房屋建筑面積 平方 米(其中套內(nèi)建筑面積______平方米);房屋用途為 ;該房屋附屬物_____ 面積 平方米。
第二條 該房屋(包括附屬物)總價款為人民幣 元整。
第三條 該房屋為濟南鐵路局職工房改房,房屋產(chǎn)權(quán)證尚未正式辦理下來,甲方 保證在交易時該房屋產(chǎn)權(quán)明晰沒有產(chǎn)權(quán)糾紛。有關(guān)抵押債務、稅項及物業(yè)水電費等,甲方均在交易前辦妥。交易后如有上述未清事項,由甲方承擔全部責任。
第四條 甲方負責該房屋產(chǎn)權(quán)證辦理手續(xù)并承擔相關(guān)的辦理費用,該房屋的面積 如有變動,以房管部門測繪后新出測繪圖所載為準。
第五條 甲乙雙方以誠意負責的態(tài)度進行該房屋的產(chǎn)權(quán)交易事宜,并為規(guī)避交易 風險,就交易步驟作如下約定。第一步、甲乙雙方約定時間到對該房屋現(xiàn)場查看并由甲方就該房屋實際狀 況向乙方說明。
第二步、甲乙雙方約定時間到房管部門確認該房屋的產(chǎn)權(quán)及相關(guān)情況,并 在確認后,由乙方向甲方支付定金人民幣 元整,同時甲乙雙方簽訂本 向書。
第三步、甲方應在收取定金后,于 年 月 日之前辦理完結(jié)該房屋 的房屋產(chǎn)權(quán)證。
第四步、甲方在房屋產(chǎn)權(quán)證辦理完結(jié)后到所轄派出所辦理戶口遷出手續(xù) 并知會乙方。然后,甲乙雙方約定時間辦理網(wǎng)簽和過戶手續(xù),同時乙方向甲方支 付人民幣元整先行款。 第五步、甲方應于收到乙方先行款后 日內(nèi)向乙方交房,乙方在收房 查驗后將尾款人民幣 元整支付給甲方。
第六條 因本房屋所有權(quán)轉(zhuǎn)移所發(fā)生的契稅等稅費由甲乙雙方各自依法向國家 交納,其他費用,依據(jù)政府規(guī)定各自承擔。
第七條 如需通過中介機構(gòu)辦理房屋買賣事宜,中介費用由乙方負擔。
第八條 本意向書簽訂后,如乙方提出不購買該房屋,乙方已支付定金甲方不予 退還。如甲方提出不出售該房屋給乙方,應在提出之日后5個工作日內(nèi)返還給乙方雙倍定金。
第九條 本意向書內(nèi),空格部分填寫的文字與印刷文字具有同等效力。本意向書中未規(guī)定
的事項,均遵照中華人民共和國有關(guān)法律、法規(guī)和政策執(zhí)行。
第十條 本意向書在履行中發(fā)生爭議,由甲、乙雙方協(xié)商解決。
第十一條 本意向書經(jīng)甲、乙雙方簽字之日起生效。
第十二條 本意向書共2頁,一式二份,甲、乙雙方各執(zhí)一份,均具有同等效力。 甲方(簽章): 乙方(簽章):
購房意向書范文3(以下簡稱承購房)擬購買由上海千葉房地產(chǎn)經(jīng)紀有
限公司(以下簡稱房)所介紹的位于 的物業(yè),并認
可以下條款:
一.承購方愿意接受的購房條件為:
1.購房總價:______________________________________.
2.包含設(shè)施:______________________________________.
3.簽約時間:______________________________________.
4.付款時間:______________________________________.
5.其他條件:______________________________________.
二.承購方為表示購房誠意同意向方支付 的意向金,委托方于 年 月 日時之前去爭取出讓方的確定意向,一旦出讓方全部接受承購方的上述購買條件并在意向書上簽字,則承購方授權(quán)方在不通知的情況下將意向金作為購房定金付給出讓方,如果期限內(nèi)出讓方未能接受承購方條件的,則意向金立即無息返還給承購方。出讓方在本意向金書上簽字后,承購方反悔不購買或變更購買條件等其他行為致使交易不成功的,定金(原意向金)將由出讓方?jīng)]收。
戴先生
A1:戴先生,您好!
購房意向書的法律效力以及法律的性質(zhì),需要依據(jù)意向書的具體內(nèi)容進行判斷。如果意向書中明確了所購房子的具體房號并且標明了價格、房屋交付等具體的約定內(nèi)容,這些約定基本符合了買賣合同成立的構(gòu)成要件,可以看成是一個附條件附期限的預約合同。在本案例中,意向書中已明確了雙方當事人的基本情況、房屋地點、單價、面積、總房款、簽約日期等內(nèi)容,故應將該意向書視為成立并有效的預約合同。
那么,購房意向書存在合法的法律效力,如房東單方面提高價格,就涉嫌違約,一旦違約,買受人可通過訴訟的方式主張相應賠償。故您可以通過訴訟的方式維護自己的權(quán)益,若意向書中規(guī)定了違約責任及違約金相關(guān)事宜,則您可以主張房東賠償違約金;若意向書中未作出相關(guān)規(guī)定,則您可以主張房東雙倍返還定金。
另外,根據(jù)我國《合同法》第一百一十六條規(guī)定,當事人既約定違約金,又約定定金的,一方違約時,對方可以選擇適用違約金或者定金條款。故您在主張賠償時,可在雙倍返還定金及違約金(若事先有約定則可適用)中選擇其一進行索賠。
但特別需要注意的是,若意向書中寫明交付的5萬元是“訂金”,一方違約,另一方無權(quán)要求其雙倍返還,只能得到原額償還5萬元。就訂金而言,沒有約定其作為定金性質(zhì)的,當事人主張定金權(quán)利的,根據(jù)以往判例及相關(guān)法律法規(guī),人民法院不予支持,無法雙倍返還。
中介與房東之間構(gòu)成居間合同雙方當事人,中介系居間人,房東系委托人。二手房買賣中,中介的活動能否最后促成簽約具有不確定性,并非完全由中介的意志決定。中介與買賣雙方簽訂的是居間合同,根據(jù)居間合同的規(guī)定,在中介方無過錯的情況下,無須對買賣雙方的違約行為承擔責任。中介的義務在于提供真實的信息,為雙方達成交易提供服務。故若您通過訴訟的方式來維護自己的權(quán)益,可以同時以中介和房東為被告。但具體而言,關(guān)于中介是否應該承擔相應責任,則須進一步看其是否違反作為居間方的忠實義務,才能判斷其是否有過錯。若其有過錯,則需承擔相應責任。
當前,因房地產(chǎn)市場的快速發(fā)展,類似糾紛數(shù)量呈上升趨勢。很多房主在簽訂買賣合同后,看到房價漲幅巨大或因為其他各種主客觀因素,便在交付房屋或辦理房屋過戶手續(xù)前反悔,并尋找各種理由拒絕交房或干脆對買房人置之不理。遇到這種情況,守約一方在向人民法院提訟時,建議選擇讓違約方承擔違約責任,解除房屋買賣合同,而不要選擇合同的繼續(xù)履行。
為了防止業(yè)主在房價上漲時毀約或買家在房價下跌時退房,建議在簽訂房屋買賣合同時約定較高的定金(但不可超過房屋交易價格的20%)或違約金,增加違約成本,違約成本大于或等于房價上漲或下跌的價值時,可在一定程度上避免一方違約情況的發(fā)生。
Q2:王律師,你好!
兩個月前,我在一家中介機構(gòu)看中了一套房屋,該房屋位于上海市閘北區(qū)。當時業(yè)務員介紹這套房子系房東委托中介掛牌出售的,房東當時在外地。由于這套房屋地段較好,價格也較為合理,當天我就在中介處簽下了一份購房協(xié)議,交付了定金3萬元,也約定了簽正式的購房合同的日期。但是,兩個星期前房東表示要加價數(shù)十萬元,否則不簽正式的購房合同,這份意向書無效。我去找中介機構(gòu)交涉,但中介機構(gòu)說當時的購房協(xié)議是以業(yè)務員私人名義簽下的,表示不愿負責,同時出具了與房東之間的委托書,讓我找房東和業(yè)務員做交涉。請問,這種情況下我是否可以維護自己的利益?如果可以,我該怎么做?
楊女士
AZ:楊女士,您好!
購房協(xié)議的法律效力需要依據(jù)該協(xié)議的具體內(nèi)容進行判斷。若能夠構(gòu)成預約合同,則可以按照合同相關(guān)規(guī)定判斷合同雙方及中介方是否違約(在下文會具體進行分析);若不能構(gòu)成預約合同,合同自始無效,則不可主張當事方的違約責任,在這種情況下若要主張定金的返還,若符合不當?shù)美臉?gòu)成要件,則可以以不當?shù)美麨槔碛?,主張當事方返還3萬元。
如果購房協(xié)議能夠視為成立并有效的預約合同,則預約合同中一切不違法的約定就是雙方當事人應當遵守的義務,具有法律效力。購房協(xié)議存在合法的法律效力,如房東單方面提高價格,就涉嫌違約,一旦違約,買受人可通過訴訟的方式主張相應賠償,故您可以通過訴訟的方式維護自己的權(quán)益。
我國《合同法》第四十九條規(guī)定:“行為人沒有權(quán)、超越權(quán)或者權(quán)終止后以被人名義訂立合同,相對人有理由相信行為人有權(quán)的,該行為有效。”我國法律明確作出了表見的相關(guān)規(guī)定,其意義在于維護制度的誠信基礎(chǔ),保護善意第三人的合法權(quán)益,建立正常的民事流轉(zhuǎn)秩序。在本案例中,若中介未與房東辦妥相關(guān)委托手續(xù),即以房東的名義出賣房屋,屬無權(quán)。但若中介公司能夠提供相關(guān)信息材料,足以使不知情第三人相信其有權(quán)代表房屋產(chǎn)權(quán)人出賣房屋,可能構(gòu)成表見。且從中介與您所作出的關(guān)于購房的相關(guān)約定等情節(jié)綜合考慮,可以排除中介與您惡意串通的可能,應當認定您系善意第三人。中介以房東的名義向您出賣房屋的行為符合表見的構(gòu)成要件,買賣協(xié)議相應的民事法律責任由房東承擔。至于中介方是否應該承擔相應責任,則屬于房東與中介方的糾紛問題。
而至于業(yè)務員以個人名義與買受方簽訂購房協(xié)議的問題,若中介能夠出具與房東之間的書面委托書,證明該委托合法有效,并且該業(yè)務員確實是中介公司的正式員工,則業(yè)務員系以公司職員身份行使職權(quán)之內(nèi)的行為,責任由公司承擔。故只要業(yè)務員在行為過程中,未違反法律法規(guī)相關(guān)規(guī)定及公司章程等,則其自身并無過錯,相關(guān)法律責任由公司承擔。若意向書中規(guī)定了違約責任及違約金相關(guān)事宜,則您可以主張房東賠償違約金;若意向書中未作出相關(guān)規(guī)定,則您可以主張房東雙倍返還定金。
另外,當事人既約定違約金,又約定定金的,一方違約時,對方可以選擇適用違約金或者定金條款。故您在主張賠償時,可在雙倍返還定金及違約金(若有事先約定則可適用)中選擇其一進行索賠。
綜上,若該購房協(xié)議不能夠認定為成立并有效的預約合同,合同自始無效,則您只可能以不當?shù)美麨槔碛芍鲝埉斒路椒颠€3萬元的不當?shù)美?,若要提訟,則應以定金的收受方作為被告;若該購房協(xié)議能夠認定為預約合同,可以向法院提訟,以違約為理由主張當事方雙倍返還定金或賠償協(xié)議約定的相應違約金,可同時以房東及中介方作為被告,其中中介方是否應該承擔連帶責任則需具體分析其是否違反忠實義務。
在二手房買賣糾紛中,常見的是買受方、中介方與出售方三方為當事人。在此之中,中介與賣家雙方在委托房屋買賣交易時,必須要有書面委托協(xié)議和正規(guī)授權(quán)證明才能代簽字。同時,中介在與買家簽訂賣房合同時,也必須出具賣家簽字的委托手續(xù),在沒有任何委托手續(xù)的前提條件下,僅口頭同意是無效的,中介也是無權(quán)的,中介與客戶簽訂的這份協(xié)議是無效的。若出現(xiàn)以上情況,如簽合同時,對方不是房主本人,也沒有房主的委托書和身份證,要保留好該事實的證據(jù)材料,以此作為中介方未按照居間合同約定導致簽字主體錯誤的證據(jù)。
甲方:
乙方:
本認購意向書在雙方平等自愿的基礎(chǔ)上,經(jīng)協(xié)商一致達成以下內(nèi)容 :
一、 房產(chǎn)信息
乙方意愿認購甲方
項目房屋 一 套,愿意支付人民幣元 (大寫:人民幣 萬圓整)作為該意向登記的訂金(該筆款項可納入認購金或正式合同項下沖抵購房款)。
意向房源基本情況:
意向一:房號 :,建筑面積 平方米(最終以測繪機構(gòu)實測為準);
意向一:房號 :,建筑面積 平方米(最終以測繪機構(gòu)實測為準);
以上意向房號僅為乙方單方意思表示,非為甲方發(fā)出的邀約,甲方不確保乙方具有優(yōu)先購買該套房屋的資格。
二、 房產(chǎn)價格
房屋出售價格甲方于項目正式開盤前告知乙方,乙方可就告知的價格與甲方進行協(xié)商,就經(jīng)協(xié)商一致的房屋價格簽署房屋認購書及房屋銷售合同。
三、其他約定事項
1、乙方應于開盤認購當日(具體時間以本公司告知為準)帶齊訂金收據(jù)、登記人身份證及本意向書到甲方招商中心,按預訂人順序進行房屋認購。
2、如甲乙雙方就房屋售價價格經(jīng)協(xié)商未能達成一致的或就經(jīng)協(xié)商一致的房屋價格乙方未能按約定的期限與甲方簽署房屋認購書及房屋銷售合同的,該協(xié)商價格失效,本意向書亦自行失效,自該等事由發(fā)生之日起30個工作日內(nèi)甲方無息退還乙方交納的訂金。
3、房屋銷售合同項下的付款方式及付款期限于雙方簽署房屋認購書或正式簽訂房屋買賣合同時協(xié)商確定。
4、乙方如要求合同簽約的主體更名(僅指與簽署認購意向書的乙方名稱不一致)、調(diào)換已確定的房屋、或改變付款計劃的,應于簽署房屋銷售合同前提出書面申請,并須經(jīng)甲方同意。
5、本意向書一式三份,自雙方簽字蓋章后生效,甲方執(zhí)貳份,乙方執(zhí)壹份(簽署銷售合同時須提交甲方)。
出賣方(甲方): 認購方(乙方):
[中圖分類號] R-092 [文獻標識碼] A [文章編號] 1673-7210(2012)05(b)-0123-02
本研究中所謂中醫(yī)古籍圖像,是指中醫(yī)古籍文獻中所刊載的各類插圖而言。數(shù)量眾多、內(nèi)容豐富的中醫(yī)古籍圖像是中醫(yī)學知識除文字外表述的重要補充,也是中醫(yī)學知識最為直觀、形象的表達。然而當前鮮見有關(guān)于中醫(yī)圖像的成規(guī)模、系統(tǒng)性研究,在中醫(yī)古籍數(shù)字化建設(shè)中,也未曾將圖像作為單獨的研究課題。2011年,中國中醫(yī)科學院基本科研業(yè)務費第三批自主選題團隊項目——“中醫(yī)古籍圖像分類整理研究”課題(ZZ03076),首次對中醫(yī)古籍圖像資源進行了系統(tǒng)的調(diào)研,并搜集到大量的圖片資料[1],由此中醫(yī)醫(yī)史文獻研究者第一次全面而系統(tǒng)的掌握了如此海量的圖像資源,這確為一件幸事。
然而如果繼續(xù)沿用傳統(tǒng)的文獻學和史學的方法對數(shù)量如此眾多的圖像進行整理研究,單憑人工的方法就已顯得力不從心。因此借助于現(xiàn)代信息技術(shù)的數(shù)據(jù)庫技術(shù),實現(xiàn)對古籍圖像的管理,并利用知識管理的理論方法,對圖像資源進行標引,將大大提高古籍圖像研究的深度,并對從整體上把握圖像的分類具有很好的規(guī)范作用。本研究擬探討一個集中醫(yī)古籍圖像管理與應用功能為一體的數(shù)據(jù)平臺的構(gòu)建方案。
1 系統(tǒng)設(shè)計
中醫(yī)古籍圖像數(shù)據(jù)平臺擬采用多層化、模塊化和組件化的理念進行架構(gòu)設(shè)計,構(gòu)建一個分布式應用、集中式管理的WEB應用系統(tǒng)平臺。該系統(tǒng)分為:數(shù)據(jù)資源層、加工管理層、查詢應用層。
1.1 數(shù)據(jù)資源層
包括中醫(yī)古籍圖像、索引和系統(tǒng)3個數(shù)據(jù)庫。中醫(yī)古籍圖像數(shù)據(jù)庫:存儲中醫(yī)古籍圖像文件及其標引信息。索引數(shù)據(jù)庫:存儲中醫(yī)古籍圖像數(shù)據(jù)庫中的索引信息,為高速查詢檢索提供數(shù)據(jù)層支持。系統(tǒng)數(shù)據(jù)庫:存儲用戶信息和用戶產(chǎn)生的各類數(shù)據(jù)等。
1.2 加工管理層
包括圖像信息著錄、圖像主題標引和用戶管理、內(nèi)容管理4個功能模塊。圖像信息著錄:為數(shù)據(jù)加工人員提供對古籍圖像的外部信息進行著錄、修改、審核的平臺;圖像主題標引:為圖像研究人員提供對圖像內(nèi)容進行主題以及關(guān)系標引的平臺;用戶管理:為管理員提供管理用戶和用戶權(quán)限的工具;內(nèi)容管理:為管理員提供審核、刪除各類用戶在評注、交流、通訊過程中所產(chǎn)生相關(guān)內(nèi)容的工具。
1.3 查詢應用層
包括檢索查詢、評注交流、統(tǒng)計報表、圖像網(wǎng)絡4個功能模塊。檢索查詢:向用戶提供圖像查詢和輸出功能;評注交流:為用戶提供學習、交流的平臺;統(tǒng)計報表:為研究人員提供查詢結(jié)果統(tǒng)計報表及多種統(tǒng)計圖示生成的功能。圖像網(wǎng)絡:為研究人員提供動態(tài)圖像關(guān)系網(wǎng)絡展示功能。
2 系統(tǒng)功能
2.1 加工管理功能
2.1.1 圖像信息著錄 數(shù)據(jù)加工人員首先將經(jīng)過裁切、正畸、除污等技術(shù)處理過的圖像文件上傳進本系統(tǒng),然后以張為單位,分別對圖像的各項外部信息進行著錄。
2.1.2 圖像主題標引 圖像研究人員可對圖像的分類、關(guān)系、主題等內(nèi)容信息進行標引。①分類標引:按照多種分類體系,對每張圖像進行多重標引;②關(guān)聯(lián)標引:根據(jù)構(gòu)建圖像網(wǎng)絡的需要,對圖像間的等同、版本、組圖、衍化等關(guān)系進行標引;③主題標引:以《中國中醫(yī)藥學主題詞表》[2]作為工具,對圖像所反映的內(nèi)容主題進行標引。
2.1.3 用戶管理 管理員可對在系統(tǒng)中工作或使用者,賦予不同的角色類型,并對用戶的權(quán)限進行管理。
2.1.4 內(nèi)容管理 管理員可對系統(tǒng)中各類用戶在使用過程中產(chǎn)生的諸如留言、評注、筆記、通訊等各類信息進行審核管理。
2.2 查詢應用功能
2.2.1 檢索查詢 系統(tǒng)向用戶提供簡單查詢、組合查詢、關(guān)聯(lián)查詢3種方式。①簡單查詢:用戶可以通過輸入單一的圖像信息或主題詞作為條件,檢索相應的圖像;②組合查詢:用戶可以通過輸入組合的圖像信息或主題詞作為條件,檢索相應的圖像;③關(guān)聯(lián)查詢:用戶可以一張圖像作為中心,檢索與其相關(guān)的其他圖像。以上查詢結(jié)果,均可按照年代、作者、主題等條件進行排序。
2.2.2 評注交流 為用戶提供對古籍圖像進行筆記、批注的功能;為加工人員及科研人員提供一個問題交流、討論、反饋的機制;提供加工管理層與查詢應用層之間用戶間點對點的通訊功能。目的是為用戶搭建一個科研學習的虛擬平臺。
2.2.3 統(tǒng)計報表 按照年代、作者、類型、刊刻單位、版本、流傳等條件統(tǒng)計分析圖像數(shù)目,生成報表或其他圖示形式。
2.2.4 圖像網(wǎng)絡 按照圖像間的關(guān)聯(lián),生成圖像網(wǎng)絡。以展示圖像的主題關(guān)系以及流傳譜系。
3 系統(tǒng)實現(xiàn)
系統(tǒng)功能實現(xiàn)的基礎(chǔ)為中醫(yī)古籍圖像數(shù)據(jù)庫,以下簡要介紹一下數(shù)據(jù)庫主要表的結(jié)構(gòu)(圖2)。
3.1 圖像表
①圖像編碼(主鍵):識別圖像的標識。②圖名:圖像的名稱,原有圖名的沿用原圖名;原沒有圖名的可自擬圖名,也可為空。③出處(外鍵):古籍圖像所出自的古籍及其版本。④特征:圖像諸如彩圖、墨圖、雕版、手繪等形態(tài)特征。⑤分類:圖像的分類號。⑥關(guān)聯(lián):圖像相關(guān)的其他圖像的編碼。⑦主題詞:描述圖像內(nèi)容的主題詞,域值為《中國中醫(yī)藥學主題詞表》。⑧有無圖像:布爾值。⑨圖像文件:鏈接圖像的文件。⑩備注:關(guān)于圖像其他信息的備注說明。
3.2 書目表
①古籍編碼(主鍵):識別古籍的標識。②書名:古籍的正題名,以《中國中醫(yī)古籍總目》[3]的題名著錄作為主要參考。③版本:古籍的版本,以《中國中醫(yī)古籍總目》的版本著錄作為主要參考。④總目號:古籍在《中國中醫(yī)古籍總目》中的編號。⑤主要責任者:古籍的編者、著者等。⑥次要責任者:古籍的校注者、增補者等。⑦成書時間:古籍成書的時間。⑧刊刻時間:版本刊刻的時間。⑨內(nèi)容提要:對古籍作者、成書、版本、主要內(nèi)容等的概括性介紹。⑩載圖數(shù):古籍所刊載的圖像數(shù)量。館藏單位(外鍵):古籍的館藏單位。借閱號:一般為館藏單位為古籍編制的財產(chǎn)號。
3.3 館藏單位表
①館藏單位編碼(主鍵):識別館藏單位的標識,以《中國中醫(yī)古籍總目》的館藏地代碼為參照。②館藏單位名稱:館藏單位的名稱。③地址:館藏單位的地址。④聯(lián)系人:古籍借閱聯(lián)系人的姓名。⑤聯(lián)系方式:古籍借閱聯(lián)系人的聯(lián)系方式。
4 相關(guān)基礎(chǔ)研究
中醫(yī)古籍圖像數(shù)據(jù)平臺的構(gòu)建,技術(shù)實現(xiàn)僅是其中一方面的工作,關(guān)于中醫(yī)古籍圖像的分類研究,分類體系的建立以及主題標引的規(guī)范,才是研究的難點和重點之所在。系統(tǒng)功能研究成果的水平,主要取決于以上基礎(chǔ)性研究工作的進展情況。
“中醫(yī)古籍圖像分類整理研究”課題先期取得的成果,為圖像系統(tǒng)性研究提供了很好的示范和指導作用,希望以此平臺的構(gòu)建為契機,整合起分散于全國的人力、智力和古籍圖像資源,為中醫(yī)古籍圖像的進一步深入、系統(tǒng)、可持續(xù)的研究奠定良好的基礎(chǔ)。
[參考文獻]
[1] 秦秋.我國首次開展中醫(yī)古籍圖像研究[N].中國中醫(yī)藥報,2011-12-16(001).
1.前言
傳統(tǒng)的基于內(nèi)容的圖像檢索系統(tǒng),是利用圖像的底層特征進對圖像進行檢索的。主要工作集中在對圖像的顏色、紋理、空間關(guān)系等特征的識別,及對相關(guān)的圖像特征匹配的相似度度量上。通常這種方式都是采用順序的檢索算法實現(xiàn)的。然而面對如今海量的圖像庫,那么圖像特征向量的相似性比較計算就非常復雜,因此利用這種順序的方法是非常低效的。受樹形結(jié)構(gòu)的啟發(fā),將圖像庫進行預處理,先對圖像庫進行聚類,然后在層次聚類的基礎(chǔ)上再進行匹配,以樹的結(jié)構(gòu)進行檢索。
2.詞匯樹的生成
2.1 關(guān)鍵詞模型
通過圖像的自動分割,將圖像分為很多有意義的圖像區(qū)域,對每個圖像區(qū)域分別提取特征,這樣圖像將用一系列的局部特征來描述,每一個局部特征都是描述一小塊圖像的向量,然后根據(jù)局部特征的相似性對圖像進行比較。圖1顯示兩個圖像如何通過提取局部特征與特征匹配進行比較和區(qū)分。
這樣把來自許多圖像的局部特征,通過聚類劃分特征空間,形成了一系列視覺詞匯。因此,每一個圖像被簡單的用一組離散的關(guān)鍵詞來表示。為了檢索,我們可以建立一個圖像視覺詞匯的索引,其類似于傳統(tǒng)的關(guān)鍵詞搜索引擎檢索文本文件的方法。
2.2 詞匯樹的建立
詞匯樹是一種高效的基于視覺詞匯檢索圖像的數(shù)據(jù)結(jié)構(gòu)。面對海量的圖像庫,一個樹狀結(jié)構(gòu)允許在次線性時間內(nèi)進行的關(guān)鍵詞查詢,而不是掃描全體關(guān)鍵詞去尋找匹配的圖片,這樣就大幅度的提高了檢索速度。
我們將訓練樣本圖像輸入,這樣可以提取到大量的圖像特征,詞匯樹學習使用分層k-均值法。詞匯樹的形成需要控制兩個參數(shù):水平數(shù)量L指定的樹的高度,分支因子B指定的子節(jié)點的數(shù)量。一個視覺詞匯就是詞匯樹中的節(jié)點,它是每一次聚類的聚類中心。作為傳統(tǒng)的詞袋模型,它代表圖像中一個臨近特征空間的小局部區(qū)域。該結(jié)構(gòu)的層次布局與非層次的詞袋表示相比,允許我們快速地量化特征。在分支因子為B,樹的高度為L的詞匯樹在中,視覺詞匯的數(shù)目為:
(1)
樹的布局如圖2描述。
3.圖像的匹配
詞匯樹不僅直接定義了視覺詞匯的概念,同時指出了一種有效的檢索過程。樹的每個節(jié)點,也就是樹的視覺詞匯,與一個倒排文件相關(guān)聯(lián),在這個文件中保存著包含該視覺詞匯的訓練樣本圖像的儲存指針列表,同時該文件也一直在不斷地追蹤該視覺詞匯出現(xiàn)在每幅圖片中的頻率。通過對圖像局部特征的提取和量化,將目標圖像q用一組特征點來表示,其中t為詞匯樹中節(jié)點的數(shù)量。與q類似的圖像,通過查找與q的特征一致的視覺詞匯的相關(guān)圖像,可以快速被找到。然后,通過對每個視覺詞匯的表決,為這些圖像排序。參加表決的方法如同普通的基于內(nèi)容的快速圖像檢索。通過比較目標圖像q的特征向量和數(shù)據(jù)庫中待檢索圖像的特征向量在詞匯樹中自上而下的路徑相似程度,計算兩幅圖像的距離,我們可以確定兩幅圖片的相似性。
在范數(shù)下,將查詢圖像q和數(shù)據(jù)庫圖像d兩幅圖像的距離定義為:
(2)
在2范數(shù)的定義下,兩幅圖像的相似性度量公式簡化為:
(3)
在2范數(shù)下的相似性計算公式使得查詢圖像和數(shù)據(jù)庫圖像的距離度量轉(zhuǎn)化為其特征向量對應維度上同時為非零元素的累積求和。用這種方法使得檢索效率得到較大提高。
4.檢索結(jié)果
本實驗的數(shù)據(jù)庫采用corel圖片庫。圖3是查詢和返回的結(jié)果。
在圖3中,左上角為目標圖像,緊接著后面的12幅圖像的是系統(tǒng)返回的檢索結(jié)果。從實驗結(jié)果中可以看出,盡管存在著視角、尺度的不同,但是,檢索的結(jié)果具有較高的正確率。
我們分別對corel圖像庫中的十類圖像進行了檢索,從檢索結(jié)果來看,本文的算法都具有比較高的檢索準確率,要說明的是對于非洲人物的圖像集,檢索準確率相對比較低,原因在于這類圖像的背景較為復雜,對于局部特征的提取受圖像干擾的影響較大所致。通過實驗,我們得出,圖像檢索中對于圖像特征的提取以及查詢圖像的量化過程,計算時間是比較快的,然而對于圖像集中的圖像的特征量化過程是比較慢。那么當我們面向?qū)嶋H的用戶時,這部分的計算是通過對圖像數(shù)據(jù)庫的預處理完成的,可以離線進行,是不會影響用戶的查詢時間。
5.小結(jié)
隨著科技的發(fā)展,面對當今海量的圖像庫,傳統(tǒng)的檢索方法已經(jīng)不能很好的滿足人們的需求。本文利用詞匯樹結(jié)構(gòu)進行圖像檢索,為從海量的圖像庫中檢索目標圖像提供一條新思路。從實驗結(jié)果來看,利用這種方法檢索效率以及檢索準確性都有顯著的提高。
參考文獻
[1]陸建江,張亞非,徐偉光等.智能檢索技術(shù)[M].北京:科學出版社,2009,135-150.
[2]楊曉強.基于顏色量化與聚類的圖像檢索算法[J].微計算機信息,2008,V24(3-4):272-287.
[3]謝東升.基于文本的圖片搜索引擎研究[D].上海:同濟大學,2008.
中圖分類號:TP391.12 文獻標識碼:A
1 引言
漢語是一種大字符集語言,漢字數(shù)量大、結(jié)構(gòu)復雜,漢字字形描述和特征計算方法是漢字信息處理的一項基礎(chǔ)研究,對于各種漢字處理應用和漢字教學都有重要意義。前人對漢字字形描述做過很多工作,一般是把漢字的構(gòu)形方式按照人的認知分類,并使用人認知的部件、筆畫來描述。這些描述確實對相當多的漢字有效,但也存在著大量的歧義和描述缺失,無法支持字形特征的自動提取、分析和計算。由于缺少統(tǒng)一有效的字形形式化描述體系和字形特征計算方法,造成目前漢字處理應用中存在一系列障礙,主要方面列舉如下:
各種漢字識別輸入(包括手寫識別輸入)軟件,受到識別原理的限制,只能識別訓練集內(nèi)的漢字,無法輸入集外的漢字。
漢語教學和國際推廣都需要對錯字進行定量分析,如錯字的描述、界定、分類、計算機輔助漢字書寫學習、書寫水平標準化自動評測等,但目前計算機沒有錯字輸入和比較的方法,嚴重制約了對錯字進行深入定量分析研究的水平。
漢字文本識別后的校對處理、涉及漢字的歷史文化研究(如古籍字、異體字的比對、界定)等應用都需要分析漢字字形的相似性,但目前也沒有支持這種字形分析計算的有效方法。
獨立建立的集外字表因缺少有效比對工具而難以共享和歸并。
各種電子出版物以及網(wǎng)絡出版物中有許多集外字,這些字可以輸出,但讀者無法輸入,從而也無法查詢、檢索包含這些字的內(nèi)容。
因此,建立一種統(tǒng)一有效的漢字字形形式化描述體系和基于該體系的字形特征計算方法,能涵蓋所有正字和錯字字形,并支持字形特征的自動計算,對解決漢字處理面臨的這些問題具有重要意義。本文給出了一種漢字網(wǎng)格字形描述方法,實驗表明,該方法具有描述一切可能漢字字形(包括錯字)骨架的能力,并支持自動提取不同顆粒度構(gòu)字元素、結(jié)構(gòu)關(guān)系等字形特征,為字形特征自動分析計算提供了一種可行、有效的手段,從而也為基于字形計算的各種應用建立了基礎(chǔ)。
2 漢字字形主要描述方法分析
許多學者看到,目前漢字處理方法存在的問題是把漢字整體作為編碼單位來處理,這樣就無法分析計算其內(nèi)部成分。實際上,漢字字形是可以分解來劃分結(jié)構(gòu)類型的,并且以部件、筆畫作為基本的構(gòu)形單位。從這樣的觀點出發(fā),有一批研究成果。代表性方法如下:
(1)漢字信息字典
上海交通大學漢字編碼組編,科學出版社1988年出版。主要特點是將漢字遞歸地分解成部件和筆畫的組合,組合的結(jié)構(gòu)類型有左右、上下、包容、嵌入4種,描述了7785個漢字。
(2)漢字部件規(guī)范(GF3001-1997)
國家語言文字工作委員會于1997年12月1日,主要特點是窮盡式地列出了國家標準通用多八位編碼字符集中20 902個漢字的部件表,并把集內(nèi)漢字依據(jù)這些部件進行了逐個拆分。
(3)表意文字描述序列IDS(Ideographic Description Characters Sequence)
Unicode聯(lián)盟于2000年提出的表意文字描述符系統(tǒng),作為Unieode 4.0標準。主要特點是將漢字遞歸地分解為部件的組合,組合的結(jié)構(gòu)類型有12種。將結(jié)構(gòu)類型符作為操作符,漢字或部件作為操作數(shù)來組成前綴表達式,可以表現(xiàn)Unicode集內(nèi)的絕大部分漢字和一些集外漢字的字形。從實現(xiàn)的效率考慮,對表達式的長度和其中連續(xù)排列的部件個數(shù)有限制。部件集合不固定,同一漢字的描述方法也不固定。IDS的出現(xiàn),反映了ISO也認識到單純用擴充編碼的方法支持更多漢字是行不通的,只有從漢字的構(gòu)形出發(fā),才能真正解決漢字的計算機表示問題。
(4)漢語文檔處理語言CPL(Chinese Document Processing Language)
臺北“中研院”信息技術(shù)研究所文獻處理實驗室在20世紀90年代開發(fā),為古籍整理服務。主要特點是將漢字遞歸地分解成部件和字根的組合,組合的結(jié)構(gòu)類型有直連、橫連、包含三種,還有幾種重疊形式。確定出1千多字根,表現(xiàn)4千多部件,涵蓋了5萬多字形。并用CPL作為其研發(fā)的漢字構(gòu)形數(shù)據(jù)庫的字形描述語言。
(5)漢字數(shù)學表達式
國防科技大學孫星明,殷建平,陳火旺等于2002年提出,將漢字遞歸地分解為部件的組合,組合類型有6種(左右,上下,左下包,左上包,右上包,全包含),固定出505個部件。并給出了關(guān)于結(jié)構(gòu)類型的結(jié)合律和傳遞律,使得字內(nèi)任意兩個部件的結(jié)構(gòu)關(guān)系能通過逐層的推導而得以確定。
(6)字符描述語言CDL(Character Description Language)
美國加州大學伯克利分校研究人員2003年提出的基于筆畫和部件的字形描述系統(tǒng),并采用XML作為元語言。主要特點是將漢字遞歸地分解為部件的組合,最底層的部件是筆畫。CDL沒有結(jié)構(gòu)類型的概念。它處理部件間位置關(guān)系的核心思想是:每個部件有一個隱藏的外包矩形輪廓,通過改變外包矩形斜對角頂點的坐標來達到移動和縮放對應部件的目的。小部件(可能是筆畫)的外包矩形移動和縮放后成為大部件或整字。CDL筆畫集合是固定的,筆畫的形狀用它的起點、終點、拐點的橫、縱坐標,以及走向和彎曲方向表示。CDL沒有固定的部件集合,所以它描述字形有極大的靈活性,可以描述各種可以想見的漢字,可以表現(xiàn)異體字的特異性。再者,它對筆畫的描述,不僅表示出了形狀,而且表示出了走向和彎曲方向,可用于漢字書寫方法的教學。
以上各種字形描述方法的共同思想是把漢字看作大部件到小部件的遞歸組合,因而有很強的字形能產(chǎn)性,一定程度上克服了大字符集方案的封閉性弊病。這幾種方案都是面向人的字形描述體系。字形拆分的主要原則是漢字的字理,這些原則對于一般大眾和沒有漢字文化背景的外國人而言仍很難使用;另一方面,描述中都采用了漢字教學中引入的結(jié)構(gòu)類型思想。這一思想對于面向人的教學確實很有效,但并不適合進行計算機處理。因為相當多漢字的結(jié)構(gòu)類型是有歧義的,有些字到底是上下結(jié)構(gòu)還是包圍結(jié)構(gòu)或是獨體部件,依賴于人的認知。比如“著”是左上包圍結(jié)構(gòu),而“眷”不看成左上右三包圍結(jié)構(gòu)卻看成上下結(jié)構(gòu),就很費解?!俺恕笨闯伞氨薄?包圍“禾”,“裹”看成“衣”包圍“果”,則需要專業(yè)知識?!翱ā钡闹虚g一橫應歸在上半部還是歸在下半部,則是見仁見智。一個字由于結(jié)構(gòu)類型的認知不同,從而描述不同而會被計算機誤識成兩個字。而拆分標準不統(tǒng)一、不規(guī)范,也難以被機器實現(xiàn)。
相對而言,CDL只固定筆畫不固定部件,直接列出位置坐標而不劃分結(jié)構(gòu)類型,一定程度上避免了前幾種方案的缺點。但是,CDL固定筆畫,以筆畫作為基本特征的顆粒度過大,影響了特征抽取和比較的效果。如“我”和“找”特征很相似,但是由于字中間是一橫還是兩橫造成兩個字的結(jié)構(gòu)類型、部件有極大差別。又如“單”同“草”、“卓”相似度很高,但中間一豎穿進了“日”,造成描述相差非常大。對于這類差別,這幾種方案都能表現(xiàn)出來,使得不同字形不被混淆,但卻不能很好表現(xiàn)相似性的程度。而字形相似性比較功能存在大量的應用需求,應當是字形描述系統(tǒng)具備的重要能力。如果這些計算能力存在局限,就難以支持這些應用。
手寫漢字識別方法依靠字形特征來識別漢字,描述了訓練集內(nèi)不同字形的差別特征,對訓練集內(nèi)字的處理能力很強,但缺少訓練集外字的特征,限制了對集外漢字的識別處理能力。
3 漢字網(wǎng)格字形描述及實驗
漢字網(wǎng)格字形是一種采用平面網(wǎng)格結(jié)構(gòu)來描述漢字字形骨架的形式化方法。
3.1 網(wǎng)格字形描述
漢字字形網(wǎng)格是由n×n個小正方形合成的大正方形。
每個小正方形區(qū)域內(nèi)含有28個筆段:
各頂點到它所在邊中點的連線,共8段;
各頂點到它對邊中點的連線,以連線中點
為界分為2個筆段,共2×8=16段;
一對角線以中點為界分為2個筆段,共
2×2=4段。
整個網(wǎng)格有24n2+4n個筆段。
網(wǎng)格中每個筆段可取有線或無線兩種狀態(tài),所有有線的筆段分布構(gòu)成了漢字的網(wǎng)格字形描述。
在網(wǎng)格字形描述體系下,筆段為基元,所有的漢字字形(包括異體字、錯字),都對應網(wǎng)格中有線筆段的一種分布(但并非任意有線筆段分布都是一個可能的漢字)。有線筆段的不同分布可能對應具有相同結(jié)構(gòu)或相似結(jié)構(gòu)的漢字。筆段類型編碼及網(wǎng)格字形描述如圖1所示。
3.2 基本筆畫描述
橫:從左向右、首尾相連的水平筆段所組成的序列。筆段編碼模式的正則式為A+;
豎:從上到下、首尾相連的垂直筆段所組成的序列。筆段編碼模式的正則式為B+;
撇:從右上到左下、左斜方向、傾角不增的首尾相連筆段所組成的序列。特別地,對撇尾接水平筆段、豎尾接左斜筆段的情況也作為撇來處理。筆段編碼模式的正則式為B*E+H*D*A*|B*H+D*A*|B*D+A;
捺:從左上到右下、右斜方向、傾角不增的首尾相連筆段所組成的序列。特別地,對捺尾接水平筆段、豎尾接右斜筆段的情況也作為捺來處理。筆段編碼模式序列的正則式為B*F+G*C*A*|B*G+C*A*|B*C+A*。
基本筆畫中起始筆段首端在網(wǎng)格字形中的位置定義為基本筆畫的首部,結(jié)束筆段尾端在網(wǎng)格字形中的位置定義為基本筆畫的尾部。因此,橫筆左端為首,右端為尾;豎筆上端為首下端為尾;撇筆右上端為首,左下端為尾;捺筆左上端為首,右下端為尾。
基本筆匭最小外包矩形在網(wǎng)格字形中的位置,定義為基本筆畫在網(wǎng)格字形中的位置。網(wǎng)格字形中基本筆畫圖例如表1所示。
3.3 復合筆畫描述
在網(wǎng)格字形中,復合筆畫刻畫書寫時由基本筆畫首尾或尾尾連接得到的靜態(tài)大筆形,由基本筆畫的類型編碼模式及連接方式來定義。例如:“豎鉤”定義為基本筆畫類型模式為“1[3_13_2_3_3]”,且“尾尾”連接方式構(gòu)成的復合筆畫。這里用“尾+尾”表示兩個基本筆畫以尾部位置重合來連接。其中“+”表示位置重合,“~”表示位置很接近。各種復合筆畫類型詳細描述如表2所示。
基本筆畫連接歧義處理:
1)在一字中,“豎”和“橫”尾首相連時,如果是“口”的組成部分,“豎”和“橫”不組合為“豎折”復合筆畫,算作兩個筆畫。如“口、國、回、四”等,其他情況組合為“豎折”復合筆畫,如“山、區(qū)、葛、斷”等。
2)在一字中,“撇”和“橫”尾首相連時,如橫是“門”或“門”的組成部分,“撇”和“橫”不組合成“撇折”復合筆畫。如“白、自、奧”等,其他情況組合為“撇折”復合筆畫。如“幺、去”等。
3)在一字中,出現(xiàn)“橫”的尾部同時連接“豎”的首和“撇”的尾時,“橫”優(yōu)先與“豎”組合為“橫折”復合筆畫,而不作為“撇尾帶橫”處理。如“的”。
4)在一字中,出現(xiàn)“橫”的首部同時連接“豎”的尾和“撇”的尾時,“橫”優(yōu)先與“豎”組合為“豎折”復合筆畫,而不與“撇”組合為“撇折”。如“區(qū)”。
3.4 筆畫位置關(guān)系描述
漢字字形是一種二維平面圖形,字形中筆畫間的相對位置關(guān)系是字形描述的重要組成部分。在網(wǎng)格字形中,兩筆畫間的位置關(guān)系可以采用方向關(guān)系矩陣來描述。設(shè)A是網(wǎng)格字形中任意筆畫,A與其他筆畫的相對位置描述如下:以A的最小外包矩形各邊及其延長線作為邊界,將網(wǎng)格平面化分為以A為中心的3行3列呈“井”字分布的9個平面區(qū)域,分別表示筆畫A周圍的8個不同方位,如圖2所示。對各區(qū)域從上到下、從左到右按行、列編號,例如,1行1列區(qū)域表示筆畫A的左上區(qū)域,3行3列區(qū)域表示筆畫A的右下區(qū)域,建立一個3×3的二值方陣R,元素R[i,j]值表示某筆畫B的最小外包矩形區(qū)域與筆畫A周圍的第i行j列區(qū)域相交的情況:如與該區(qū)域相交,R[i,j]=1,否則R[i,j]=0,因此,方陣R的值表示了A,B的位置關(guān)系。方陣R稱為A,B的方向關(guān)系矩陣。圖2表示“心”字第二點(標為A的區(qū)域)外包矩形各邊及延長線將網(wǎng)格平面劃分的9個區(qū)域,它與其他筆畫B、C、D的方向關(guān)系矩陣值如下:
類似地可以得出字形中任意兩筆畫間的方向關(guān)系矩陣。兩個字形對應筆畫間方向關(guān)系矩陣的差值表示了字形結(jié)構(gòu)的差異度。此外,筆畫間的相交關(guān)系可直接通過交點坐標來描述。兩字形中對應筆畫交點數(shù)的差值表示了相交關(guān)系的差異度,相交關(guān)系作為位置關(guān)系的一種特例情況處理。
字形描述實驗是采用自行開發(fā)的手寫繪制工具來進行漢字的網(wǎng)格字形描述,目前,完成了GB2312字符集中全部6763個漢字、近1000個外國留學生漢語作文錯字和部分異體字形的網(wǎng)格字形描述。并實現(xiàn)了網(wǎng)格字形中基本筆畫和復合筆畫的自動提取,提取準確率達到100%。實現(xiàn)了字形中筆畫間位置關(guān)系的自動計算。實驗表明,n一12的網(wǎng)格可以表示絕大多數(shù)漢字的字形,n=16的網(wǎng)格可以表示所有漢字的字形。這些實驗結(jié)果說明網(wǎng)格字形是一種可靠、有效和擴展能力強的可計算字形描述模型。
4 結(jié)束語
網(wǎng)格字形描述方法,用定義好的有限方向的直線段――筆段作為描述單位,特征規(guī)范、顆粒度適當,克服了現(xiàn)有漢字字形描述體系存在的以下問題:
1)以結(jié)構(gòu)類型、部件、筆畫作為描述單位,特征顆粒度過大,特征值集合固定,無法表現(xiàn)開放的漢字集合,無法比對一些相似字的差別。
2)點陣字形或TrueType曲線輪廓字形的描述基元顆粒度小,但規(guī)范性差,包含許多因書寫工具不同和美學觀念不同帶來的書法上的差別,這些差別不是漢字字形的本質(zhì)差別。
中圖分類號:G42 文獻標識碼:A 文章編號:1673-7717(2009)05-0978-02
廣西中醫(yī)學院研究生院自2004年在中醫(yī)藥專業(yè)開設(shè)的《中西醫(yī)結(jié)合基礎(chǔ)實驗技術(shù)與方法》課程,2005年改為《中西醫(yī)結(jié)合實驗技術(shù)與方法》受到研究生的歡迎,2006年以后改為《中醫(yī)藥科研實驗方法與技術(shù)》并增加實驗教學,取得良好的教學效果,在此基礎(chǔ)上結(jié)合2006年廣西壯族自治區(qū)教育廳“十一五”中西醫(yī)結(jié)合實驗教學中心建設(shè),提出“優(yōu)勢資源共享的中醫(yī)藥研究生綜合性《實驗技術(shù)與方法》課程體系建設(shè)”的課題,意在加強研究生創(chuàng)新能力培養(yǎng)和提高研究生培養(yǎng)的質(zhì)量。國外的許多院校的實驗技術(shù)課程多以每一種器官,系統(tǒng)所關(guān)聯(lián)的多個基礎(chǔ)學科內(nèi)容聯(lián)合起來,進行多學科的綜合性實驗教學。國內(nèi)各院校比較,西醫(yī)類院校在研究生中開設(shè)實驗技術(shù)課程較多,內(nèi)容廣課時多;多數(shù)在40學時以上。各學科的實驗教學相互獨立進行,各學科之間融會結(jié)合的較少??傮w實驗教學顯得廣泛、細致而各科知識較松散。而中醫(yī)院校在研究生中開設(shè)實驗技術(shù)課程少學時短,內(nèi)容單一,多數(shù)中醫(yī)院校僅開分子生物學和實驗動物學兩門,且實驗課時很少,造成中醫(yī)藥專業(yè)研究生實驗能力差,不能適應現(xiàn)代中醫(yī)藥科研發(fā)展的要求。本文結(jié)合本院在中醫(yī)藥專業(yè)研究生《實驗技術(shù)與方法》課程構(gòu)建的實踐及問題,探討如何以優(yōu)勢資源共享和教育創(chuàng)新思想為導向,構(gòu)建中醫(yī)院校中醫(yī)藥專業(yè)研究生《實驗技術(shù)與方法》課程體系。
1 課程集各種最常用的現(xiàn)代實驗方法和技術(shù)為一體
基于教育創(chuàng)新思想和跨學科跨專業(yè)聯(lián)合形式,跨學科協(xié)作編寫綜合性教材《中醫(yī)藥科研實驗技術(shù)與方法》,教材內(nèi)容集生理學、病理學、生物化學、組織學、免疫學、分子生物學等學科的現(xiàn)代實驗研究方法和技術(shù)為一身,教材涉及中醫(yī)藥科研選題、中醫(yī)藥研究方法、科研項目申報等科研基本要素,實驗技術(shù)包含計算機與生物機能實驗系統(tǒng)、膜片鉗技術(shù)、電子顯微技術(shù)、血清藥理學技術(shù)、細胞化學與免疫組化、肌電腦電心電技術(shù)、蛋白質(zhì)組學技術(shù)、層析電泳光譜技術(shù)、分離與提純技術(shù)、細胞培養(yǎng)技術(shù)、印跡雜交與RNA探針技術(shù)、PCR、DDPCR、BT-PCR技術(shù)等,是現(xiàn)代中醫(yī)藥科學實驗的最常用、最前沿的實用技術(shù)。
2 整合優(yōu)勢資源以專題講座的形式授課
本課程由相關(guān)科室的教師8人組成,其中教授(科主任)4人,副教授3人,助理研究員1人。課程總學時30學時,理論教學24學時,每周3學時,共8周,采用分章節(jié)、分內(nèi)容,由本專業(yè)掌握該項技術(shù)的教授、副教授以專題講座的形式授課。實驗教學6學時/次,目前可供選擇的實驗模塊有6個。具體的實驗內(nèi)容則采取與研究生本人的培養(yǎng)方向相一致或相類似的實驗模塊,由學生自由進行選擇。
3 因人施教 因材施教 按專業(yè)和培養(yǎng)方向的不同分層次實驗教學
創(chuàng)新教學是分層次地因人、因材、因?qū)I(yè)施教,不是單一標準的統(tǒng)一的要求。分層次教學是讓不同目的、不同發(fā)展方向的學生都有適合自己的學習內(nèi)容。要求主講教師對學生們的導師姓名、研究方向、專業(yè)特點,有較全面地了解,并制定出不同層次實驗模塊。這樣可以有效地避免單一標準造成的人力、財力的浪費。同時也讓每個學生有適合自己的學習和發(fā)展的目標。
4 構(gòu)建完善的課程體系結(jié)構(gòu)
本課程為中醫(yī)藥專業(yè)研究生的專業(yè)基礎(chǔ)課程,使用教材為本院自編教材《中醫(yī)藥科研實驗方法與技術(shù)》,教學內(nèi)容以中醫(yī)藥科研方法與技術(shù)介紹為主,注重中醫(yī)藥專業(yè)研究生科學素質(zhì)的培養(yǎng),強調(diào)基礎(chǔ)理論與實驗技能的統(tǒng)一性和完整性。體現(xiàn)中醫(yī)與西醫(yī)相結(jié)合的特點,使學生對當前科學技術(shù)的新發(fā)展有更多的了解。本課程體系結(jié)構(gòu)分七章:第一章,緒論;第二章,中醫(yī)藥實驗研究的選題;第三章,中醫(yī)藥實驗研究的方法;第四章,科研項目的申報及注意事項;第五章,實驗研究的儀器設(shè)備及使用;第六章,實驗研究的基本技術(shù)與方法;第七章,實驗的常用技術(shù)與方法簡介。
5 改革實驗模塊與考核評價方法
目前已開展的實驗模塊有:①肺通調(diào)水道動物模型制備;②家兔中心靜脈壓測定;③動物生命指標(血壓,呼吸,心電,尿量)同步測定;④大鼠含藥血清的制備;⑤參觀相關(guān)實驗儀器設(shè)備和細胞室;⑥模擬填寫科研項目申請書等實驗模塊供學生選擇??己藬M采用有利于研究生專業(yè)發(fā)展和個性發(fā)展的模塊式和等級制評分。模塊式就是將考核內(nèi)容按培養(yǎng)方向不同分為若干個考核模塊。等級制就是在每一個模塊按難易程度的不同分為若干個等級,由學生按自身發(fā)展方向選擇。
6 課程實施中存在的問題
網(wǎng)絡計算模式已得到廣泛應用,Internet技術(shù)使全球范圍信息傳遞易于實現(xiàn),直到近期發(fā)展起來的電子商務也倍受業(yè)界關(guān)注。在企業(yè)內(nèi)部使用Internet技術(shù)建立的Intranet使企業(yè)能在信息基礎(chǔ)上實現(xiàn)現(xiàn)代化運營。在上述應用中,網(wǎng)絡是支撐,信息源是基礎(chǔ),處理與應用是精髓。就信息源而論,含有多種數(shù)據(jù)庫系統(tǒng)是客觀現(xiàn)實,因歷史原因,有層次、網(wǎng)狀及關(guān)系數(shù)據(jù)庫系統(tǒng),還有近幾年發(fā)展起來的對象-關(guān)系及面向?qū)ο蟮臄?shù)據(jù)庫系統(tǒng)。對一個大的企業(yè),各部門使用不同的數(shù)據(jù)庫系統(tǒng)經(jīng)常出現(xiàn),不是人們刻意追求異構(gòu)數(shù)據(jù)庫,而是現(xiàn)實中難以避免。即使是一個經(jīng)過信息規(guī)劃的企業(yè)部門,因時間推移,人遷,以及數(shù)據(jù)庫技術(shù)的發(fā)展和數(shù)據(jù)庫市場的變化,都可能造成異構(gòu)數(shù)據(jù)庫的局面。各數(shù)據(jù)庫公司的技術(shù)都在發(fā)展,也造成這些公司不同版本的數(shù)據(jù)庫系統(tǒng)并存。因此在網(wǎng)絡環(huán)境下,異構(gòu)數(shù)據(jù)庫存在,要求異構(gòu)數(shù)據(jù)庫聯(lián)合使用的要求會長期存在下去。
對用戶而言,希望屏蔽掉各種層次的異構(gòu)特性,不必知道各物理數(shù)據(jù)庫系統(tǒng)的知識,不必自己去進行數(shù)據(jù)轉(zhuǎn)換和匯總結(jié)果,而簡便的全局查詢得到一個綜合結(jié)果,這就是異構(gòu)數(shù)據(jù)庫聯(lián)合使用技術(shù)主要的研究內(nèi)容。
:7000多字 參考文獻
200元
中圖分類號:TP311文獻標識碼:A文章編號:1009-3044(2011)15-3727-02
An Ontology Matching Method for Heterogeneous Knowledge Integration in Animated Cartoon Project
ZHANG An-qi1,2, LIAO Liang-cai1, SONG Yang3
(1.College of Information System and Management, National University of Defense Technology, Changsha 410073, China; 2.Hunan Animated Cartoon Engineering and Technology Center, Changsha 410073, China; 3.Changsha Department, Hunan Mobile, Changsha 410073, China)
Abstract: Nowadays, there are many intractable problems in knowledge management and sharing under the ground of animated cartoon project management. In this paper, we applied ontology matching technique into the knowledge management of animated cartoon project management, and provide a solution for sharing common knowledge in developing animated cartoon project. Finally, we discuss the ontology matching techniques which are suitable for animated cartoon project knowledge management.
Key words: animated cartoon; ontology matching; knowledge management; project management
1 緒論
目前,數(shù)字卡通技術(shù)在我國得到了蓬勃發(fā)展。作為一種知識密集型的產(chǎn)業(yè),數(shù)字卡通的制作與開發(fā)過程中涉及到大量的結(jié)構(gòu)化和非結(jié)構(gòu)化的知識,這些知識的分類和抽象、建模與形式化、集成與共享以及管理和重用等都是當前需要深入研究的問題[1]。
然而,由于當前我國數(shù)字卡通制作企業(yè)在技術(shù)儲備和規(guī)模上仍然處于較低水平,大型數(shù)字卡通項目的開發(fā)通常需要多個企業(yè)協(xié)作完成。為了更好地實現(xiàn)資源共享和軟實力整合,需要加強對項目相關(guān)知識的管理和共享[2]。本文將本體匹配技術(shù)應用到數(shù)字卡通項目異構(gòu)知識集成中,探討了如何通過本體匹配方式構(gòu)造異構(gòu)本體之間的結(jié)盟和映射,進而實現(xiàn)異構(gòu)知識的共享和集成。
2 本體異構(gòu)性與本體匹配
本體是一種將領(lǐng)域知識概念化和模型化的方法,已經(jīng)被廣泛用于描述計算機能夠處理的據(jù)的語義信息[3]。然而,不同組織開發(fā)的本體所描述的領(lǐng)域可能相關(guān),也可能重疊;對相關(guān)聯(lián)領(lǐng)域的描述可能采用不同的語言和組織方式;而且對領(lǐng)域知識描述在側(cè)重點和詳細程度上也不可能完全相同[4]。因此,盡管使用本體的初衷是為了能夠?qū)︻I(lǐng)域知識的描述達成共識,但是事實上實際應用卻中出現(xiàn)了大量異構(gòu)本體,而且還將異質(zhì)問題的提高到了更高的層次。本體的異質(zhì)性主要體現(xiàn)在如下幾個方面[5]:
① 由于使用不同的語言進行領(lǐng)域描述而造成的本體語法異質(zhì)問題。
② 由于同一實體在不同本體中命名的不同而造成的術(shù)語異質(zhì)問題。
③ 由于對同一興趣領(lǐng)域建模的差別而造成的語義異質(zhì)問題。
④ 由于對同一領(lǐng)域的描述在詳細程度上的不同而造成的粒度異質(zhì)問題。
⑤ 由于在不同的上下文環(huán)境中對同一實體的解釋不同而造成的異質(zhì)問題。
為了解決上述異構(gòu)問題,通常通過本體匹配技術(shù)建立本體之間的語義映射。
定義1:本體可以定義為,其中:
C為本體類集合;P為本體屬性集合,區(qū)分為數(shù)據(jù)類型屬性和對象屬性;Ins為本體的實例集合; Rp?哿P是一系列關(guān)系屬性,包括對稱屬性、傳遞屬性、函數(shù)屬性和反函數(shù)屬性等;Hc?哿C×C為概念繼承層次結(jié)構(gòu);Hp?哿P×P為無環(huán)的屬性繼承層次結(jié)構(gòu);函數(shù)給定了屬性的定義域;函數(shù):給定了屬性的值域。其中對象屬性的值域是概念集合,而數(shù)據(jù)類型屬性的值域為數(shù)值類型集合DR;函數(shù)card:C×PN描述了每個概念-屬性對的基數(shù)約束。
定義2:對應(Correspondence)是異構(gòu)本體中實體之間的一種語義關(guān)系,通常通過特定的匹配算法來建立。
定義3:映射(Mapping):本體間的語義映射是一個三元組m=<OS,OT,r>,其中OS為源本體,OT為目標本體,r為這兩種符號之間的語義關(guān)系,一般是指等價或者包含關(guān)系。
本體之間的映射根據(jù)具體應用的不同其表達形式也有所不同,在本文中使用的語義映射是一種輕量級的本體映射,主要用途是建立本體元素之間的語義關(guān)聯(lián),為上層的推理服務提供支撐。
3 基于本體的異構(gòu)知識管理框架
數(shù)字卡通開發(fā)領(lǐng)域涉及到的知識面非常廣泛,包括來自政策法規(guī)、共性支撐技術(shù)、軟硬件設(shè)備、企業(yè)生產(chǎn)經(jīng)營等多個方面,僅僅依靠單個本體很難對所有的知識統(tǒng)一建模。而且大一統(tǒng)的本體建模方式不僅費時費力,而且本體的可用性和靈活性都比較差。為了將分散在項目流程各個角落的知識相互關(guān)聯(lián)起來,通常采用本體網(wǎng)絡來實現(xiàn)分布、異構(gòu)知識的建模。
項目知識共享是數(shù)字卡通項目知識管理的過程中扮演重要角色。在此可以給出圖1所示的知識共享與管理示意圖。通過異構(gòu)本體的匹配和集成,將各種異構(gòu)知識拼接和整合成一個本體網(wǎng)絡,網(wǎng)絡中的每個節(jié)點就是一個面向具體應用或者某一領(lǐng)域的本體,而網(wǎng)絡的邊就是本體間的映射,知識的傳遞、分發(fā)和管理都通過該核心的本體網(wǎng)絡來完成。本文假設(shè)相關(guān)的本體均已經(jīng)構(gòu)建完成,關(guān)鍵是探討如何構(gòu)建各種異構(gòu)本體之間的語義映射,即找到適用于數(shù)字卡通項目知識管理的本體匹配方法。
4 適用于數(shù)字卡通項目知識管理的本體匹配方法
本體匹配的目標就是找到異構(gòu)本體中實體之間的聯(lián)系,如本體間的因果關(guān)系,包含關(guān)系和不相交關(guān)系等等。本體中的實體可能是復雜的表達式,如公式、概念定義、查詢和術(shù)語表達式等,通過匹配本體能夠使本體中所表現(xiàn)的知識和數(shù)據(jù)相互協(xié)作。在數(shù)字卡通項目協(xié)作開發(fā)過程中開發(fā)的本體,通常并不能進行完全匹配,因此通過下述步驟實現(xiàn)本體匹配:
1)名稱匹配過程。通過通用匹配過程實現(xiàn)本體元素在名稱上的匹配。通常將實體名轉(zhuǎn)化為矢量來處理,使用歐氏距離和余弦相似度(公式1)等來測度實體之間的相似程度。
(1)
2)結(jié)構(gòu)匹配過程。對本體的結(jié)構(gòu)方面的信息,通常是對本體的局部結(jié)構(gòu)和全局結(jié)構(gòu)分別進行進一步匹配。Similarity flooding 是一種面向結(jié)構(gòu)的通用匹配算法,該算法的基本思想是節(jié)點間的相似度依賴于它們的相鄰節(jié)點的相似度。算法基本步驟為:
a將本體轉(zhuǎn)換為一個有向圖,其中節(jié)點為兩個本體的概念對,如果兩個節(jié)點的概念對之間存在一定的關(guān)系則兩個節(jié)點之間存在一條邊;
b為邊分配權(quán)重,一般來說如果源節(jié)點的出度為n,則邊的權(quán)重為1/n;
c為每個節(jié)點賦予初始相似度σ0,可以使用基本匹配方法來給出初始相似度;
d根據(jù)選擇的公式計算每一節(jié)點的σi+1相似度;
e將每個節(jié)點的σi+1相似度除以最大值以進行標準化;
f如果相似度的變化不超過閾值ε,即|σi+1(e,e’)- σi (e,e’)|< ε。
3)實例匹配。關(guān)注本體實例層面,通常分為取值域的匹配和實例數(shù)據(jù)的匹配兩個方面。本文將實例匹配問題單獨劃分出來單獨匹配,因為實例匹配經(jīng)常需要人工參與。
4)匹配的補償。對于未能正確建立匹配的環(huán)節(jié)加以補償,這一步的工作是為了使匹配過程更加準確。
基于上述步驟基本上能夠解決大多數(shù)本體異構(gòu)的問題,進而為消除數(shù)字卡通項目中的知識異構(gòu)問題奠定基礎(chǔ)。
5 結(jié)論
在國家科技支持重點項目 “面向全網(wǎng)運營的數(shù)字卡通工程化技術(shù)研究與應用”(2007BAH14B00)的支持之下,本文探討了適用于數(shù)字卡通項目知識管理背景的本體匹配的方法。后續(xù)研究會就這一問題做更為深入的研究,給出相應的原型系統(tǒng)。
參考文獻:
[1] 楊鳴喚.中國動漫產(chǎn)業(yè)存在的主要問題及對策研究[D].上海:華東師范大學,2007.
[2] 晃翠花,金鑫.基于本體的企業(yè)間信息協(xié)作的研究[J].東華大學學報:自然科學版,2003,29(6):43-49.
[3] 陸建江,張亞菲,苗壯,等.語義網(wǎng)原理與技術(shù)[M].北京:科學出版社,2007.
高校藝術(shù)專業(yè)學生是未來社會主義接班人,將他們打造成為德藝雙馨的藝術(shù)家是高等教育的重要責任。因此加強對藝術(shù)專業(yè)學生思政教育成為當前高校發(fā)展的重中之重。
一、高校藝術(shù)專業(yè)學生心理特征
(一)重技能輕文化
藝術(shù)專業(yè)學生進入高校途徑有所不同,他們在高考前需要加試,然后參加文化課考試才能夠進入高校接受專業(yè)化藝術(shù)教育。相比較之下,藝術(shù)專業(yè)學生文化課分數(shù)偏低,且高校招生僅關(guān)注其技能,對藝術(shù)專業(yè)學生產(chǎn)生了影響,使其更加關(guān)注專業(yè)技能,忽視了文化課學習。因此進入高校的藝術(shù)專業(yè)學生文化課功底較弱,且思想政治素養(yǎng)較為匱乏。
(二)缺乏理想信念
認為,社會意識是由社會存在決定。高校作為新思想、新觀念發(fā)源地,藝術(shù)專業(yè)學生經(jīng)過藝術(shù)熏陶,對于新鮮事物的敏銳度更高。因此藝術(shù)學生多思維活躍、性格活潑,對于新鮮事物的接受能力較強。但是藝術(shù)學生對自身未來發(fā)展定位較為模糊,極易受到不良現(xiàn)象的影響,造成理想信念缺失,社會責任感非常薄弱。
(三)紀律性不強
在校藝術(shù)專業(yè)學生多為90后,他們成長在我國經(jīng)濟高速發(fā)展新時期,物質(zhì)與精神獲得了極大的滿足,具有鮮明的時代特征,情感豐富。一些術(shù)專業(yè)學生過于自信,活在自己營造的藝術(shù)世界,目中無人[1]。常常只顧及自身利益,過于表現(xiàn)自己,缺乏紀律性??梢?,藝術(shù)專業(yè)學生思想政治教育效果不盡人意,還有待進一步提升。
二、構(gòu)建高校藝術(shù)專業(yè)學生思想政治教育方法模式
(一)明確教育目標
大學生接受教育最多的方式是課堂教學,因此思政教育中,課堂是重要陣地。針對藝術(shù)專業(yè)學生特點,應將專業(yè)課與思政教育有機結(jié)合,兼顧專業(yè)教學與思政教育雙重需求。如在欣賞《自新大陸交響曲》過程中,教師可以結(jié)合德沃夏克寫作背景,將捷克對故鄉(xiāng)的思念之情表達出來,使得學生在欣賞藝術(shù)作品的同時,能夠更好地把握住作者的情懷。而美術(shù)系學生在欣賞美術(shù)作品時,如《自由引導人民》,教師可以對作品內(nèi)涵進行介紹,使學生深入理解作品,引導學生樹立堅定的信念,使其能夠認識到作為人民藝術(shù)家為人民、為民族、為國家服務的重要性,以此來達到教育學生的目的。
(二)滲透傳統(tǒng)文化
在思政教育中,教師要加強對傳統(tǒng)文化的滲透,提升民族自信心。中華傳統(tǒng)藝術(shù)形式種類繁多、博大精深。藝術(shù)建立在歷史、文學等基礎(chǔ)之上,具有較強的綜合性。因此藝術(shù)專業(yè)學生思政教育也應堅持該項原則,應適當延伸其深度和廣度,改變單一學習模式,深化對藝術(shù)知識的學習,以此來提升自身鑒賞力[2]。除此之外,高校藝術(shù)專業(yè)還應將戲劇、戲曲及京劇等融合到一起,豐富藝術(shù)體系,在此基礎(chǔ)上進行思政教育,能夠提升學生思想境界,從而實現(xiàn)思政教育目標。
(三)重視隱性教育
校園藝術(shù)活動是校園生活的一部分,能夠豐富學生生活,且能夠達到隱性思政教育。首先,教師要從頂層入手,選擇恰當?shù)那腥朦c,采用多樣形式,以此來適應新時代藝術(shù)學生心理特點,為思政教育實踐活動奠定堅實的基礎(chǔ)。同時,還可以利用節(jié)日等機會,舉行與節(jié)日主題相一致的活動。如清明節(jié)時,可以舉行祭奠民族英雄的朗誦會等;中秋節(jié)舉行古典舞大賽等,將思政教育無形滲透至校園藝術(shù)活動當中,從而促進學生思想發(fā)展?,F(xiàn)階段,高校藝術(shù)文化活動尚未形成完善的運行機制,但出具雛形的校園文化已經(jīng)在各所高校開展[3]。如北大、清華等知名高校,舉辦的各類活動等,既能夠在活動中弘揚愛國主義精神、還能夠體現(xiàn)大學精神。其他高校也可以根據(jù)自身特點和實際情況,舉辦相應的活動。如創(chuàng)作與校園生活、景觀等相關(guān)的藝術(shù)作品,使得學生能夠更好地傳承學生愛國等情結(jié),且能夠更好地營造良好的教育環(huán)境。
三、結(jié)語
根據(jù)上文所述,藝術(shù)專業(yè)學生作為我國社會主義精神文明建設(shè)的重要力量,其思想、觀念正確與否直接決定了祖國未來發(fā)展。藝術(shù)專業(yè)學生與一般專業(yè)學生有所不同,個性鮮明、理想思想欠缺。因此高校應樹立現(xiàn)代教育理念,以理想信念為基礎(chǔ),將愛國主義作為重點,重視隱性教育,并積極滲透傳統(tǒng)文化,引導高校學生樹立正確思想觀念,在學習藝術(shù)內(nèi)涵的同時,能夠培養(yǎng)學生優(yōu)秀的藝術(shù)品質(zhì),除此之外,教師也要樹立好榜樣,從而達到事半功倍的思想政治教育目標。
參考文獻: