急求2012美国数学建模C题翻译!

来源:学生作业帮助网 编辑:作业帮 时间:2024/05/12 00:15:29

急求2012美国数学建模C题翻译!
急求2012美国数学建模C题翻译!

急求2012美国数学建模C题翻译!
破案模型
您的组织,ICM正在调查一个作案阴谋.调查者非常有信心,因为他们知道阴谋集团的几名成员,但他们希望在进行逮捕之前能找出其他成员和领导人.主谋者和所有可能涉嫌同谋的人都以复杂的关系为同一家公司在一个大办公室工作. 这家公司一直快速增长,并在开发和销售适用于银行和信用卡公司的计算机软件方面打出了自己的名气. ICM最近从一个82个工人的小集体那儿得知了一个消息,他们认为这个消息能将帮助他们在公司里找到目前身份尚不明确的同谋者和未知的领导人的最有可能的人选.由于信息流通涉及到所有的在该公司工作的工人,所以很可能在这次信息流通中有一些(或许很多)已经确定的传播者实际并不涉及阴谋.事实上,他们确定他们知道一些并不参与阴谋的人.
建模工作的目标是确定在这个复杂的办公室里谁是最有可能的同谋.
一个优先级列表是最理想的,因为ICM可以根据这个来调查,**,和/或询问最有可能的候选人.
一个划分非同谋者与同谋者的分割线也将是有益的,因为可以对每个组里的人进行清楚的分类.
如果能提名阴谋的领导人,那对于检察官办公室也是非常有帮助的.
在把当前情况下的数据给你的犯罪建模团队之前,你的上司给你以下情形(称为调查EZ),那是她几年前在另一座城市工作时的案例.她对她在简单案件的工作非常自豪,她说,这是一个非常小的,简单的例子,但它可以帮助你了解自己的任务.
她的数据如下:
她认为是同谋的十人分别为Anne#, Bob, Carol, Dave*, Ellen, Fred, George*, Harry, Inez, and Jaye#.(*表示之前已知的同谋,#表示事先已知的非同谋者)
她对她的案件的28个消息记录按照她的分析 依据主题进行了编号.
Anne to Bob:你今天为什么迟到了? (1)
Bob to Carol:这该死的Anne总是看着我.我并没有迟到. (1)
Carol to Dave: Anne 和 Bob又再为Bob的迟到吵架了. (1)
Dave to Ellen:我今天早上要见你.你什么时候能来?把预算文件顺便带过来. (2)
Dave to Fred:我今天随时随地都可以去见你.让我知道什么时候比较好.我需要带预算文件吗? (2)
Dave to George:我待会见你---有很多需要谈的.我希望其他人都准备好.获得这项权利? 很重要. (3)
Harry to George:你似乎很紧张.怎么回事?不用担心,我们的预算会好的. (2)(4)
Inez to George:我今天真的很累.你呢,还好吗? (5)
Jaye to Inez:也不怎么样今天(?).今天一起去吃午饭怎么样? (5)
Inez to Jaye:幸好一切都很平静.我已经精疲力竭,不能做午饭了今天.抱歉! (5)
George to Dave:现在来见我! (3)
Jaye to Anne:你去吃午饭吗今天? (5)
Dave to George:我没法去,现在正要去见Fred. (3)
George to Dave:见完他后到我这来.(3)
Anne to Carol:谁来监督一下Bob?他整天游手好闲的.(1)
Carol to Anne:别管他.他和George and Dave合作得很好.(1)
George to Dave:这个很重要.该死的Fred.Ellen怎么样了? (3)
Ellen to George:你和Dave谈过了吗?(3)
George to Ellen:还没.你呢?(3)
Bob to Anne:我没有迟到.而且你知道我午饭时间都在工作呢.(1)
Bob to Dave:告诉他们我没有迟到.你了解我的.(1)
Ellen to Carol:联系Anne安排下个星期的预算会议日程,还有,帮我让George冷静点.(2)
Harry to Dave:你有没有注意到George今天看上去又很紧张/有压力?(4)
Dave to George:该死的Harry觉得你很紧张.别让他担心,免得他四处打探.(4)
George to Harry:我只是工作得太晚,家里又有点问题.不用担心,我很好.(4)
Ellen to Harry:我忘了今天的会议了,怎么办?Fred会在那的,而且他比我更了解预算.(2)
Harry to Fred:我觉得明年的预算会让一些人很有压力的.或许你今天该花点时间让大家安心.(2)(4)
Fred to Harry:我觉得我们的预算很正常,我没觉得会有人感到有压力.(2)
通信记录结束.
你的上司指出,她只分配和编号了5个不同的消息主题:
1)Bob的迟到,
2)预算,
3)重要的未知的问题,可能是阴谋,
4)乔治的压力,
5)午餐和其他社会问题.
正如看到的消息编码那样,一些消息根据内容有两个主题.
你的上司按照通信联系和消息类型构造的通信网络分析案件.下图是一个消息网络模型,网络图上注明了消息类型的代码.
您的上司说,除了已知的同谋George and Dave之外,根据她的分析 Ellen and Carol也被认为是同谋.而且不久后,Bob招认出他确实参与其中,从而希望得到减刑.而对Carol的控告后来被放弃了.
你的上司至今仍然相当肯定Inez也参与了,但却从未对她立案.
你的上司建议您的团队,确定有罪的当事人,使像Inez的人不漏网,像Carol的人不被诬陷,从而增加ICM的信用,使像Bob的人不再有获得减刑的机会.
现在的案件:
你的上司已经把目前的情况下构造成网络状的数据库,它具有和上面相同的结构,只是范围较大.调查者有一些线索表明,一个阴谋正在挪用公司的资金和使用网上诈骗盗窃在该公司做业务的顾客的信用卡资金.
她给你看的简单案件的小例子,只有10个人(节点),27条边(消息),5个主题,1个可疑/阴谋主题,2个确定的罪犯,2个已知的清白者.而到目前为止,这个新的案件却已经有83个节点,400条边(有些不止涉及1个主题),超过21000个单词的消息记录,15个主题(其中3个已被视为是可疑的),7个已知的罪犯,和8个已知的清白者.这些数据在所附的电子表格文件:names.xls,Topics.xls,Messages.xls中给出.
names.xls包含办公室的关键节点对应的员工的名字.
topics.xls包含15个主题的代号及简短说明.
由于安全和隐私问题,你的团队不会有所有的直接消息记录.
messages.xls提供传输消息的节点对,和该消息的主题(可能不止一个主题,最多3个主题).
为了使信息的沟通更加直观可视,图2提供了员工和消息链接的网络模型.
在这种情况下,不再像图1那样显示消息的主题.而是在文件Messages.xls里给出主题的数目,并在Topics.xls中给以描述.
要求:
要求1:到目前为止,已知Jean, Alex, Elsie, Paul, Ulf, Yao, and Harvey是罪犯,Darlene, Tran, Jia, Ellin, Gard, Chris, Paige, and Este不是罪犯.可以的消息主题是7,11和13.关于主题更多的信息在Topics.xls里.
建立模型和算法,把83个节点按照他是阴谋者的可能性大小排序,并解释你的模型和指标.Jerome, Delores, and Gretchen是该公司的高级经理.如果他们三个人中任何一个涉及阴谋
这将是非常有益的.
要求2:优先列表将有神秘变化,如果有新的信息告知我们说主题1也与阴谋有关,而且克里斯是一个阴谋?(即多了两个线索)
要求3:一个强大的与这个消息流通网络类似的获取和理解文本信息的技术被称为语义网络分析(semantic network analysis);作为人工智能和计算语言学的方法,它提供了一个结构,并可进行有关知识或语言的推理过程.另一个有关自然语言处理的计算语言学是文本分析text analysis.
针对我们的破案的情况,解释: 如果你能获得原始消息,那么对信息流量的上下文和内容进行语义和文字分析 对于 帮助你们的团队 开发出更好的模型和办公室人员的分类有多大的帮助和加强作用?
你有没有使用这些基于文件Topics.xls中的主题描述的功能来提高您的模型?
要求4:你的完整报告将最终提交给检察官办公室,所以一定要详细、明确地说明您的假设和方法,但不能超过20页.您可以包括你的程序作为单独的文件中的附件使你的论文不超过页面限制,但包括这些程序不是必须的.你的上司希望ICM是世界最好的解决白领、高科技的阴谋罪的机构,并希望您的方法有助于解决重要的世界各地的案件,特别是那些消息流量非常大的数据库(可能有数万的信息和数百万的单词).她特别要求你在论文中讨论 :更深入的网络,语义,消息的文本分析内容是如何帮助你的模型和建议的.
作为给她的报告的一部分,请解释你用到的网络模型技术,以及为什么使用和它们可以怎么被用于任何类型的网络数据库从而来确定,优先级排序,和对相似结点分类的技术的网络模型,而不仅仅是犯罪阴谋和消息数据.比如,给你各种图像或化学数据,其中表明了感染概率和已经确定了的一些受感染的结点,你的方法能用来在生物网络中找到感染或患病的细胞吗?

给我邮箱!要求加分

在数学中国上有呀!

2012美国数模大赛MCM/ICM,我建了个c题(犯罪那个)的群 有意向的可以加 群号202316377,欢迎大家交流了~~

177765845 2012年数学中国美赛C群

你的组织,银河犯罪建模中心(ICM),正在调查一个实施犯罪行为的阴谋。调查人员现在非常有信心,他们已经知道策划阴谋的一些成员,但是他们希望在逮捕嫌疑人之前确定其它的犯罪成员和组织的领导人。所有的嫌疑人和可能涉嫌的同谋都受雇于同一家公司,在一个大的综合办公室里工作。该公司发展迅速,正在开发和销售以自己的名字命名的计算机软件,该软件是为银行和信用卡公司服务的。ICM最近从公司的一组员工(有82人)那里...

全部展开

你的组织,银河犯罪建模中心(ICM),正在调查一个实施犯罪行为的阴谋。调查人员现在非常有信心,他们已经知道策划阴谋的一些成员,但是他们希望在逮捕嫌疑人之前确定其它的犯罪成员和组织的领导人。所有的嫌疑人和可能涉嫌的同谋都受雇于同一家公司,在一个大的综合办公室里工作。该公司发展迅速,正在开发和销售以自己的名字命名的计算机软件,该软件是为银行和信用卡公司服务的。ICM最近从公司的一组员工(有82人)那里获得了一些消息,他们认为这将帮助他们找到最有可能的未知身份的同谋者和组织领导人。由于公司中的所有员工都知晓该消息,所以一些消息的传播者(有可能很多)并没有卷入阴谋。事实上,他们可以确定有一些人没有卷入阴谋。建模工作的目标是确定在综合办公室里面的人谁最有可能是同谋者。一个优先级列表是最理想的,ICM可以按照优先级调查、监视或者审问最有可能的嫌疑人。一个判别是否为同谋人的分界线也是非常有用,可以用它来对各组人进行分类。对于检方来讲,如果模型能够识别出阴谋策划的领导人也是非常有帮助的。在你的犯罪建模团队获得当前案件的数据之前,你的上司给了你们下面的一些场景(被称作调查EZ),这些场景是几年前她在其他城市工作时遇到的。尽管她对她在EZ案件上的工作非常自豪,她仍然谦虚地说那是一个小的、简单的案例,但它可以帮助你了解你的任务。她的数据如下:

她考虑为同谋者的十个人分别为:Anne#, Bob, Carol, Dave*, Ellen, Fred,George*, Harry, Inez, and Jaye#。(*号表示事先已知是同谋者,#号表示事先已知为非同谋者)# E/ `* Q0 q1 s( P
下面是28条消息的列表,这些消息是在她的案件中获得的,每条消息后面有一个标号,这个标号反映了她对于消息的主题的分析。
安妮对鲍勃说:为什么你今天迟到了?(1)
鲍勃对卡罗尔说: 这该死的安妮总是看着我。我没有迟到。(1)" I6 k' T L7 |. h7 H( Q
卡罗尔对戴夫说: 对于鲍勃的迟到,安妮和鲍勃有争执。(1)
戴夫对艾伦说:我需要今天早晨看见你。什么时间你能来?把预算文件带来。(2)
戴夫对弗雷德说:今天我随时都可以来见你。如果时间合适就告诉我。我应该把预算文件带上吗?(2)2 L& O' w% c6 e, @8 l
戴夫对乔治说:我之后要见你---有很多话要说。我希望其他人做好准备。重要的是要得到这个权利。(3)# Y" q: T6 ?3 |4 D( M. a
哈里对乔治说:你似乎在强调。这是怎么回事?我们的预算很优秀。(2)(4)& T% ~7 R/ \3 j3 O
伊内兹对乔治说:我今天真的感觉很累。你感觉怎么样?(5)( c% W1 ~% T( ?7 v6 b
杰伊对伊内兹说:今天没有太多事可做。去吃午餐怎么样?(5)
伊内兹对杰伊说:好想法,但是我筋疲力尽了,不能做午餐了,对不起!(5)
乔治对戴夫说:谈话时间,现在!(3)
杰伊对安妮说:你今天能去吃午餐吗?(5)7 J( B9 x3 ~" ~4 E
戴夫对乔治说:我不能。我要在回家的路上去看弗雷德。(3)+ a7 I: P1 _$ N7 _; J
乔治对戴夫说:那之后到这。(3)) c& _8 w, O( D5 D
安妮对卡罗尔说:谁应该去看看鲍勃?他正在消磨时间。(1)
卡罗尔对安妮说:别理他。他和乔治、戴夫相处的很好。(1)
乔治对戴夫说:这是非常重要的。该死的弗雷德。艾伦如何?(3)
艾伦对乔治说:你和戴夫谈话了?(3)% J, o/ v/ M" T" |
乔治对艾伦说:还没有。你呢?(3)
鲍勃对安妮说:我没有迟到。我要让你知道---午餐时间我也在工作。(1)
鲍勃对戴夫说:告诉他们我没有迟。你知道的。(1)
艾伦对卡罗尔说:去找安妮,弄清楚下周预算会议的具体日程,并且帮助我让乔治冷静一下。(2)
哈里对戴夫说:你没有注意到今天乔治又压力很大?(4)
戴夫对乔治说:该死的哈里认为你压力很大。不要让他担心或者别让他察觉。(4)' z, n4 ?; P/ J2 ^6 _5 h1 t
乔治对哈里说:仅仅是因为工作太晚了,家里也出了点问题。我很好。(4)! H5 A! @2 K/ [, y0 U6 s: B
艾伦对哈里说:如果我错过了今天的会议,一切还会都好吗?弗雷德在会议上,他知道的预算比我做的好。(2)
哈里对弗雷德说:我认为明年的财政预算案使一些人压力很大。也许我们应该花些时间来让人们放心。(2)(4)/ K: w$ C' a9 ]1 n
弗雷德对哈里说:我认为我们的预算是非常健康的。我没有看到任何压力。(2)
消息流完毕。5 f( l& B& f2 T0 s1 u. [6 f
你的上司指出,她分配并编码了仅仅5种不同的消息主题:1)鲍勃的迟到,2)预算,3)重要但未知的问题,被认为是阴谋的一部分,4)乔治的压力,5)午餐和其他社会问题。正如所看到的消息编码,一些消息因为其内容被和两个主题联系在了一起。 d7 Q: e; ^. B) U) w6 M- n
你的上司分析情况采用的方法是一个网络,它显示了消息的通讯连接情况和消息的类型。下图是一个消息网络模型,网络图上注明了消息类型的代码。
4 |9 T% G1 t9 x) v: X
图1:EZ案件的消息网络- T2 i* M$ b+ v
你的上司指出,除了已知的同谋乔治和戴夫,根据她的分析,艾伦和卡罗尔分别被因为同谋起诉,后来鲍勃自己认罪,被判处减刑。但对卡罗尔的起诉后来被撤销了。你的上司仍然坚信伊内兹参与其中,但对于她的诉讼始终没能成立。你的上司给你们团队建议,一定要明确人群中有罪的一部分人,像伊内兹这样的人不能漏网,像卡罗尔这样的人也不能被错误地起诉,并且ICM得到证据,像鲍勃这样的人就没有机会获得减刑。5 v6 p# t% h1 @% Z& U
目前情况下,你的上司已经得到了一个网络形式的数据库,它有着相同的结构,但是在规模上稍大一些。有一些迹象表明,一个阴谋正在从公司挪用资金,并且使用网络欺诈窃取与公司做生意的的人的信用卡内的资金。她给你示范了一个小例子,在EZ情况下只有10个人(节点),27条边(信息),5个主题,一个可疑的/阴谋的主题,2个已知的同谋者,还有2个已知的非同谋者。 目前,这个新的情况下,有83个节点,400条边(其中一些包含不止一个主题),超过21000个字符的信息传输,15个主题(3个被视为是可疑的),7个是已知的同谋者,还有8个已知的非同谋者,数据在给出的附件:Names.xls, Topics.xls,Messages.xls和Names.xls中,names.xls包含办公室员工的姓名,和节点的数目一样。topics.xls包含了15个主题的代码和简短描述。由于安全和隐私的问题,你的团队将不能得到所有信息流的副本。messages.xls提供链接节点的,用来传递信息的边,信息中包含数字代码。一些信息包含了三个主题。为了可视化信息流动,对于人和信息传播的网络模型如图2所示。图上没有像图1一样标注消息的主题。这些主题的编号在文件Messages.xls中给出,主题描述在Topics.xls中给出。0 v$ ~+ |1 }' K/ f w R
图2:可视化的网络模型,包含83个人(节点)和400条他们之间的信息(边)

要求:$ h" o, J* R7 v! t5 N5 t; c
要求一: 目前,已知Jean, Alex, Elsie, Paul, Ulf, Yao, 和Harvey是同谋者,还知道Darlene, Tran, Jia, Ellin, Gard, Chris, Paige, 和Este不是同谋者。3个已知的可疑信息主题为7,11和13.更多的主题细节请见附件Topics.xls。根据83个节点为阴谋的可能性的大小,建立一个模型和算法对可能性大小进行排序,并说明你的模型及流程。Jerome, Delores和Gretchen是公司的高级管理人员,如果能知道他们中的任何一个是否参与了这个阴谋将是十分有用的。 要求二: 如果得到新的消息,主题一和阴谋有关,且Chris是同谋者之一,请问要求一中的排序会是什么样子的?
要求三: 和这个消息传输类似的一种强大的用来获得和理解文本信息的技术被称为语义网消息传输分析。作为一个在人工智能和计算语言学的方法,它为知识推理和语言提供了一个结构和过程。另一种在自然语言处理能力方面的计算语言学叫做文本分析。在我们的犯罪现场破坏条件下,解释语义和文本内容的分析和消息传输的背景(如果你能获得原始信息)能使您的团队开发更好的关于办公室人员的模型和归类。你是否在文件Topics.xls中有使用这些功能来进行主题描述,从而提升你的模型? . M0 O! }% ]& s# a/ O( J
要求四: 你完成的报告最终将送给检察官,所以报告中必须详细的,清晰的陈述你的假设和方法论。但是报告不能超过20页。你可以在分开的文件中包含你的程序作为附录, 附录不算在你的页数内,但这些附录不是必要的。你的上司希望ICM在解决白领,高技术的阴谋犯罪方面是世界上最好的。希望你提供的方法将有助于解决世界各地重大案件,尤其是那些拥有非常大消息传输的数据库(成千上万的人,成千上万的信息,可能数百万字)。她特别要求你在报告中要包含可以帮助你的信息模型和建议的讨论如何更深入的网络、语义和文本内容的分析的内容。作为你向她报告的一部分,说明你使用的网络建模技术,和你为什么使用它以及如何使用它在任何类型的网络数据库用来识别,优先和分类相似节点,而不仅仅是犯罪阴谋和信息数据。 例如,在得到节点感染概率和部分已经确认感染节点的各种图像或化学数据的生物网络中,你的方法能否找到感染或患病的细胞的位置?
*你提交的ICM论文应该包含一页摘要和不超过20页的解决方案,总计不超过21页。"

收起

不超过20页!!!!!!!!!!
Your ICM submission should consist of a 1 page Summary Sheet and your solution cannot exceed 20 pages for a maximum of 21 pages.
破案模型
您的组织,ICM正在调查一个作案阴谋。调查者非常有信心,因为他们知道阴谋集...

全部展开

不超过20页!!!!!!!!!!
Your ICM submission should consist of a 1 page Summary Sheet and your solution cannot exceed 20 pages for a maximum of 21 pages.
破案模型
您的组织,ICM正在调查一个作案阴谋。调查者非常有信心,因为他们知道阴谋集团的几名成员,但他们希望在进行逮捕之前能找出其他成员和领导人。主谋者和所有可能涉嫌同谋的人都以复杂的关系为同一家公司在一个大办公室工作。 这家公司一直快速增长,并在开发和销售适用于银行和信用卡公司的计算机软件方面打出了自己的名气。 ICM最近从一个82个工人的小集体那儿得知了一个消息,他们认为这个消息能将帮助他们在公司里找到目前身份尚不明确的同谋者和未知的领导人的最有可能的人选。由于信息流通涉及到所有的在该公司工作的工人,所以很可能在这次信息流通中有一些(或许很多)已经确定的传播者实际并不涉及阴谋。事实上,他们确定他们知道一些并不参与阴谋的人。
建模工作的目标是确定在这个复杂的办公室里谁是最有可能的同谋。
一个优先级列表是最理想的,因为ICM可以根据这个来调查,监视,和/或询问最有可能的候选人。
一个划分非同谋者与同谋者的分割线也将是有益的,因为可以对每个组里的人进行清楚的分类。
如果能提名阴谋的领导人,那对于检察官办公室也是非常有帮助的。
在把当前情况下的数据给你的犯罪建模团队之前,你的上司给你以下情形(称为调查EZ),那是她几年前在另一座城市工作时的案例。她对她在简单案件的工作非常自豪,她说,这是一个非常小的,简单的例子,但它可以帮助你了解自己的任务。
她的数据如下:
她认为是同谋的十人分别为Anne#, Bob, Carol, Dave*, Ellen, Fred, George*, Harry, Inez, and Jaye#.(*表示之前已知的同谋,#表示事先已知的非同谋者)
她对她的案件的28个消息记录按照她的分析 依据主题进行了编号。
Anne to Bob:你今天为什么迟到了? (1)
Bob to Carol:这该死的Anne总是看着我。我并没有迟到。 (1)
Carol to Dave: Anne 和 Bob又再为Bob的迟到吵架了。 (1)
Dave to Ellen:我今天早上要见你。你什么时候能来?把预算文件顺便带过来。 (2)
Dave to Fred:我今天随时随地都可以去见你。让我知道什么时候比较好。我需要带预算文件吗? (2)
Dave to George:我待会见你---有很多需要谈的。我希望其他人都准备好。获得这项权利? 很重要。 (3)
Harry to George:你似乎很紧张。怎么回事?不用担心,我们的预算会好的。 (2)(4)
Inez to George:我今天真的很累。你呢,还好吗? (5)
Jaye to Inez:也不怎么样今天(?)。今天一起去吃午饭怎么样? (5)
Inez to Jaye:幸好一切都很平静。我已经精疲力竭,不能做午饭了今天。抱歉! (5)
George to Dave:现在来见我! (3)
Jaye to Anne:你去吃午饭吗今天? (5)
Dave to George:我没法去,现在正要去见Fred。 (3)
George to Dave:见完他后到我这来。(3)
Anne to Carol:谁来监督一下Bob?他整天游手好闲的。(1)
Carol to Anne:别管他。他和George and Dave合作得很好。(1)
George to Dave:这个很重要。该死的Fred。Ellen怎么样了? (3)
Ellen to George:你和Dave谈过了吗?(3)
George to Ellen:还没。你呢?(3)
Bob to Anne:我没有迟到。而且你知道我午饭时间都在工作呢。(1)
Bob to Dave:告诉他们我没有迟到。你了解我的。(1)
Ellen to Carol:联系Anne安排下个星期的预算会议日程,还有,帮我让George冷静点。(2)
Harry to Dave:你有没有注意到George今天看上去又很紧张/有压力?(4)
Dave to George:该死的Harry觉得你很紧张。别让他担心,免得他四处打探。(4)
George to Harry:我只是工作得太晚,家里又有点问题。不用担心,我很好。(4)
Ellen to Harry:我忘了今天的会议了,怎么办?Fred会在那的,而且他比我更了解预算。(2)
Harry to Fred:我觉得明年的预算会让一些人很有压力的。或许你今天该花点时间让大家安心。(2)(4)
Fred to Harry:我觉得我们的预算很正常,我没觉得会有人感到有压力。(2)
通信记录结束。
你的上司指出,她只分配和编号了5个不同的消息主题:
1)Bob的迟到,
2)预算,
3)重要的未知的问题,可能是阴谋,
4)乔治的压力,
5)午餐和其他社会问题。
正如看到的消息编码那样,一些消息根据内容有两个主题。
你的上司按照通信联系和消息类型构造的通信网络分析案件。下图是一个消息网络模型,网络图上注明了消息类型的代码。

您的上司说,除了已知的同谋George and Dave之外,根据她的分析 Ellen and Carol也被认为是同谋。而且不久后,Bob招认出他确实参与其中,从而希望得到减刑。而对Carol的控告后来被放弃了。
你的上司至今仍然相当肯定Inez也参与了,但却从未对她立案。
你的上司建议您的团队,确定有罪的当事人,使像Inez的人不漏网,像Carol的人不被诬陷,从而增加ICM的信用,使像Bob的人不再有获得减刑的机会。
现在的案件:
你的上司已经把目前的情况下构造成网络状的数据库,它具有和上面相同的结构,只是范围较大。调查者有一些线索表明,一个阴谋正在挪用公司的资金和使用网上诈骗盗窃在该公司做业务的顾客的信用卡资金。
她给你看的简单案件的小例子,只有10个人(节点),27条边(消息),5个主题,1个可疑/阴谋主题,2个确定的罪犯,2个已知的清白者。而到目前为止,这个新的案件却已经有83个节点,400条边(有些不止涉及1个主题),超过21000个单词的消息记录,15个主题(其中3个已被视为是可疑的),7个已知的罪犯,和8个已知的清白者。这些数据在所附的电子表格文件:names.xls,Topics.xls,Messages.xls中给出。
names.xls包含办公室的关键节点对应的员工的名字。
topics.xls包含15个主题的代号及简短说明。
由于安全和隐私问题,你的团队不会有所有的直接消息记录。
messages.xls提供传输消息的节点对,和该消息的主题(可能不止一个主题,最多3个主题)。
为了使信息的沟通更加直观可视,图2提供了员工和消息链接的网络模型。
在这种情况下,不再像图1那样显示消息的主题。而是在文件Messages.xls里给出主题的数目,并在Topics.xls中给以描述。
要求:
要求1:到目前为止,已知Jean, Alex, Elsie, Paul, Ulf, Yao, and Harvey是罪犯,Darlene, Tran, Jia, Ellin, Gard, Chris, Paige, and Este不是罪犯。可以的消息主题是7,11和13。关于主题更多的信息在Topics.xls里。
建立模型和算法,把83个节点按照他是阴谋者的可能性大小排序,并解释你的模型和指标。Jerome, Delores, and Gretchen是该公司的高级经理。如果他们三个人中任何一个涉及阴谋
这将是非常有益的。
要求2:优先列表将有神秘变化,如果有新的信息告知我们说主题1也与阴谋有关,而且克里斯是一个阴谋?(即多了两个线索)
要求3:一个强大的与这个消息流通网络类似的获取和理解文本信息的技术被称为语义网络分析(semantic network analysis);作为人工智能和计算语言学的方法,它提供了一个结构,并可进行有关知识或语言的推理过程。另一个有关自然语言处理的计算语言学是文本分析text analysis。
针对我们的破案的情况,解释: 如果你能获得原始消息,那么对信息流量的上下文和内容进行语义和文字分析 对于 帮助你们的团队 开发出更好的模型和办公室人员的分类有多大的帮助和加强作用?
你有没有使用这些基于文件Topics.xls中的主题描述的功能来提高您的模型?
要求4:你的完整报告将最终提交给检察官办公室,所以一定要详细、明确地说明您的假设和方法,但不能超过20页。您可以包括你的程序作为单独的文件中的附件使你的论文不超过页面限制,但包括这些程序不是必须的。你的上司希望ICM是世界最好的解决白领、高科技的阴谋罪的机构,并希望您的方法有助于解决重要的世界各地的案件,特别是那些消息流量非常大的数据库(可能有数万的信息和数百万的单词)。她特别要求你在论文中讨论 :更深入的网络,语义,消息的文本分析内容是如何帮助你的模型和建议的。
作为给她的报告的一部分,请解释你用到的网络模型技术,以及为什么使用和它们可以怎么被用于任何类型的网络数据库从而来确定,优先级排序,和对相似结点分类的技术的网络模型,而不仅仅是犯罪阴谋和消息数据。比如,给你各种图像或化学数据,其中表明了感染概率和已经确定了的一些受感染的结点,你的方法能用来在生物网络中找到感染或患病的细胞吗?

收起

注意:题目有问题!

交给柯南吧

C题自己翻译吧