CN102365621B - 使用嵌入式解释器类型和变量的基于解释器的程序语言翻译器 - Google Patents

使用嵌入式解释器类型和变量的基于解释器的程序语言翻译器 Download PDF

Info

Publication number
CN102365621B
CN102365621B CN201080015827.XA CN201080015827A CN102365621B CN 102365621 B CN102365621 B CN 102365621B CN 201080015827 A CN201080015827 A CN 201080015827A CN 102365621 B CN102365621 B CN 102365621B
Authority
CN
China
Prior art keywords
type
data type
input
computer program
interpreter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201080015827.XA
Other languages
English (en)
Other versions
CN102365621A (zh
Inventor
D·R·谢里登
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
OptumSoft Inc
Original Assignee
OptumSoft Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by OptumSoft Inc filed Critical OptumSoft Inc
Publication of CN102365621A publication Critical patent/CN102365621A/zh
Application granted granted Critical
Publication of CN102365621B publication Critical patent/CN102365621B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/423Preprocessors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F8/00Arrangements for software engineering
    • G06F8/40Transformation of program code
    • G06F8/41Compilation
    • G06F8/42Syntactic analysis
    • G06F8/427Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45504Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators
    • G06F9/45508Runtime interpretation or emulation, e g. emulator loops, bytecode interpretation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45504Abstract machines for programme code execution, e.g. Java virtual machine [JVM], interpreters, emulators

Abstract

编程语言被扩展成具有嵌入式解释类型(EIT),这些EIT定义在翻译时要解析的对象和变量。具有这些EIT之一的类型的变量或数据元被称为嵌入式解释变量(EIV)。在翻译时解释(即,执行)包含EIV的控制结构。

Description

使用嵌入式解释器类型和变量的基于解释器的程序语言翻译器
发明领域
本发明涉及编程语言的自动翻译。
背景
编程语言的基本模型是根据语法所规范的符号集合,该基本模型根据语言的语义规则被解析并翻译成可执行形式。以这种形式,在每个输入结构指向输出表示中的特定结构的意义上,语言是“文字”。即,过程规范产生可执行过程规范,并且结构或类型或类规范产生用于访问存储器中的该结构或类型或类的元素的存储器模板(偏移集合)。
存在避免重复规范并识别公共处理序列和数据结构的各种方式。具体而言,出现在多个位置的公共子处理序列可通过对公共子例程的调用来替代,该公共子例程执行那个公共处理序列。出现在多个表达式中的公共子表达式还可被析出为赋值给本地变量的表达式或者析出为返回子表达式的值的单独函数。类似地,公共数据结构可用公共类型/类或结构规范来指定,其中数据成员按照该公共类型来指定。面向对象的语言允许使用这些不同类型继承的基本类型来识别并指定不同类型之间的共性,从而有效地共享基本类型数据成员以及成员函数的定义和实现。
然而,可产生包括通过这些共享机制不能处理的差异的逻辑共性。具体而言,一数据结构实现的两个规范可以是相同的,但要存储在该数据结构中的对象的类型除外。例如,散列表的两种实现可只在各自可存储的对象的类型方面有所不同。类似地,两种不同的计算平台的处理序列可以是相同的,而只在正传递给调用的常量的名称方面有所不同。
有可能通过在运行时执行包括自动运行时检查的动作来处理一些这样的情况。例如,常量可被改变成变量,其中该变量具有在运行时根据目标平台自动设置的值。类似地,散列表可具有基本类型(可能是所谓的“空”基本类型指针)并且执行实际上存储在表中以确保类型安全的类型的运行时检查。然而,这种方法招致只在运行时发现问题的风险。它还招致执行实际上在翻译时已知的并且由此逻辑上是不必要的各个方面的运行时检查的成本。最后,对于诸如Verilog生成和嵌入式软件之类的一些情况,执行运行时检查可能是不可行的。例如,路由器实现可能需要端口模块的N次实现,每次实现根据系统参数而稍有不同,但在翻译时而非运行时被静态地例示。
这些问题的一种早期解决方法是添加所谓的宏预处理器,该宏预处理器(预)处理语言输入并且随后关于所得经变换输入调用语言翻译器本身。该宏处理器允许指定由宏处理器所识别的结构,从而使它修改输入源作为文本变换。例如,C/C++预处理器是提供命名常量、宏(内联过程)、条件编译和文件蕴含的宏处理器。然而,这种方法在实践中有若干问题。具体而言,文本变换可产生非法结果和很难的出错消息、以及引入更难于捉摸的错误。它还可使软件调试困难,因为输入源没有准确地反映适当地向语言翻译器提供了什么。
最近,类型参数化的类型和过程已被包括在语言中,因此只在所使用的类型或常量方面有所不同的公共代码被指定一次,随后针对每个特定类型例示。C++模板机制是一个示例。然而,C++类型名没有语义特性。它只是一个绑定到类的类型参数。具体而言,C++类型的例示可导致只在链接时发现而不是由翻译器发现的错误。C#和Java的类属是相似的,不同之处在于它们允许为这些参数指定一些约束或不变量。
另一种方法是支持对语言中的基本语言结构的重新定义,该重新定义经常被称为元编程。例如,语言可允许程序员指定对诸如函数调用运算符之类的基本运算符的修订定义。然而,这种方法有效地创建了新语言,从而使其他程序员难以理解软件。它还未解决诸如条件编译、文件蕴含等关键的实践需求。
因此,提供用于在翻译时处理逻辑共性的机制将是本领域的进步,这些机制相对于传统方法提供了通用性和易用性的经改进组合。
概述
在本方法中,编程语言被扩展成具有嵌入式解释类型(EIT),这些EIT定义在翻译时要解析的对象和变量。具有这些EIT之一的类型的变量或数据元被称为嵌入式解释变量(EIV)。在翻译时解释(即,执行)包含EIV的控制结构。
为了更好地理解这种方法的重要性,考虑与计算机编程语言有关的“类型”的常规定义是有帮助的。通常,类型被定义为编程语言的数据元的标签或指示,其指示:a)数据元的值的容许范围;以及b)数据元的容许操作/运算符。例如,整数数据类型可具有从-32,768到32,767的容许范围并且具有包括诸如+、-、*和/之类的算术运算符在内的容许操作。作为另一个示例,串数据类型可被定义为字节阵列,这些字节根据所编码的字符表示字符并且具有诸如级联、子串提取等容许操作。试图对串(或整数的级联)执行算术运算导致在翻译时容易捕捉的类型不匹配错误,这在实践中是相当有益的。
另一种理解本方法的重要性的方式是将这种方法与诸如宏预处理和使用例如C++中的模板之类的常规方法进行比较和对比。宏文本替换本质上是“不知道类型的”进程。例如,如果命名为“xyz”的参数通过文本替换被设为特定值(例如,20),则在文本替换期间不(或不可以)进行类型检查。由此,如果声明变量“xyz”具有除整数以外的类型,则文本替换可引入类型错误。
类似地,模板元编程也不依赖于作为类型的模板,或者不依赖于在模板例示之前对模板参数的类型检查。模板是哪个代码可通过例示生成所依据的模式,并且它是通过模板例示提供的代码的具有类型(或者可以是类型)的元素。模板支持通过编译器的分段解释的形式,其中类模板提供了对参数化类型的延迟或分段指定。(部分)模板专门化提供了实现选择和循环(在递归方面)的手段,由此提供了完整的语言实用工具。C++模板编程用类型来有效地计算,从而使用循环(以及终止循环)的递归和专门化以及嵌套的enum(枚举)值来有效地指定一个值。然而,编程可能是棘手的、低效的、并且导致非显而易见的错误信息。此外,模板本身不是类型,因为模板不确定哪些运算符可合法地适用于模板、并且不确定模板的容许范围。
本工作可被视为基于类型的常规概念的扩展。因此,从这一点起,类型被定义为关于编程语言的数据元的标签或指示,其指示:a)数据元的值的容许范围;b)数据元的容许操作/运算符;以及c)在运行时或在翻译时是否要评估数据元。在翻译时评估的类型是上述的EIT。
使用类型来确定在翻译时评估哪些结构提供了若干重要的优点。
第一,在设计时未确定或者不可确定而在翻译时已知的各个方面可被解析成文字/静态表示,从而允许翻译时检查并且避免运行时绑定的开销。具体而言,支持静态例示。
第二,通过在翻译时的评估期间“在语言翻译器内”操作,翻译器访问语言的符号、从而允许使用所定义的常量,并且访问诸如类型、属性和约束的集合之类的其他对象。这允许更容易地标识句法和语义问题。
第三,因为EIT受限于语言的句法元素,所以所得代码能够更容易被其他程序员理解,并且可确保与外部经编译模块的兼容性。同样,不需要对语言语法的进一步复杂化,因为每个EIV结构使用相同的语法。例如,诸如a:=b+c之类的赋值语句的含义不取决于a、b和c是否是在翻译时评估的EIV。
根据上述原理的自动程序翻译可如下进行。输入计算机程序可用输入计算机语言提供,其中输入计算机语言提供两个数据类型集合。第一类型集合用于在运行时要评估的语言元素或结构(即,常规类型)。第二类型集合用于在翻译期间要评估的语言元素或结构(即,EIT)。输入计算机程序包括具有第一类型集合中的类型的至少一个元素或结构,以及具有第二类型集合中的类型的至少一个元素或结构。在自动翻译期间,评估输入计算机程序中的具有第二集合中的类型的任何元素或结构(即,具有EIT类型的EIV)。提供自动翻译的输入计算机程序的计算机可执行表示作为输出(例如,作为可执行机器代码)。
优选地,输入计算机语言具有预定和固定的语法,以使语言结构的语义含义不取决于该结构的类型是在第一数据类型集合中还是在第二数据类型集合中。
在一个实施例中,解释器嵌在编译器内,其中嵌入式解释器负责EIV的翻译时评估。术语“嵌入式解释类型”和“嵌入式解释变量”从这种可能性得出。
在一些实施例中,编译器包括定义输入模块(DIM),DIM具有将其输入流中的每个名称默认地作为文字处理的特性。DIM可在翻译EIT类型结构期间调用嵌入式解释器。通常,翻译器将符号(例如,猫)解释为要评估的变量名,并且要求附加句法(例如,作为“猫”的引用)强迫翻译器将该符号视为文字(即,串文字“猫”)。然而,在DIM中,默认是替换地将未引用的符号(例如,猫)解释为相应的文字(例如,“猫”),而不是要评估的变量名。DIM和嵌入式解释器可彼此递归地调用。
在一些情况下,上述自动翻译可包括将输入计算机程序翻译成只具有在运行时要评估的结构的中间表示。该中间表示可以是高级(即,人类可读)语言或低级(即,机器可读)语言。
在程序翻译期间,不必确保所有EIV根据先前在对翻译器的输入流中所定义的量来表达。通过提供供延迟例示用的EIT结构,有可能根据稍后要在翻译期间定义的量来定义EIV。一种用于提供这种延迟例示的方法是提供用于EIT/EIV结构的模板,该模板稍后可在翻译时处理期间被例示。
整个范围的控制结构可用于与EIT结构一起使用,包括但不限于“if-then”、“if-then-else”、“for”、“do-while”和“switch-case”。
通过EIT/EIV方法所提供的灵活性的示例是以下用于静态运算符超载的方法。输入计算机语言的运算符可被赋予EIT类型,并且这些运算符的翻译时评估可包括确定向运算符提供的自变量类型、以及提供其输入自变量类型与实际所提供的自变量类型相一致的运算符的版本。以这种方式,避免了运行类型的类型检查,并且不需要程序员对输入程序中的运算符的每个实例进行类型检查。
详细描述
如上所指示的,EIT提供了指定在翻译时解析(和必须解析)的源代码输入中的“变量”的能力,从而允许在翻译时选择常量值、代码和声明序列以及类型,有效地参数化类似软件单元中的差异,允许它们以常见的方式来表达。
各种类型的EIT在实践中是令人感兴趣的。EIT可与诸如“整数”之类的常规类型相对应,但指示它需要解释并且由此在翻译时具有可确定的值。作为另一个示例,EIT可与用于翻译器的输入流的类型相对应。EIT可与编程语言语法中的节点的类型和其附属类型之一相对应。例如,如果语言包括“类型”结构,则可存在与该类型结构相对应的EIT以及与用于在嵌套的(子)类型集合上迭代的迭代器类型相对应的EIT。
在一个实施例中,翻译器可被构造成包括解释器组件,该解释器组件执行关于程序的内部表示(IR)的指令。这些指令包括查询和修改该IR的手段。例如,一个实施例可包含解释器指令或命令,诸如:
从“Bar”定义类型“Foo”;
以定义从现有类型“Bar”得出(或继承)的命名为“Foo”的新类型。由此,该解释器语言的变量是指IR中的对象,并且名称值是引用的文字值。嵌在翻译器所处理的编程语言中的EIT是通过该解释器来实现的类型,从而允许解释处理被指定并从该编程语言中调用,不管它是被编译还是被解释。
在该示例语句中,引用名称“Foo”和“and”以指示它们是文字、并且特殊“定义”的关键字指示这是与翻译时评估有关的定义,而不是只在翻译时翻译(而不评估)的正常程序语句。优选地,根据本方法的翻译利用如以下所述的定义输入模块,以更有效地执行翻译时评估。
定义输入模块处理
解释器优选支持根据编程语言句法中的指定输入流来读取、解析和更新IR的操作。该操作通过解释器调用定义输入模块处理(DIM)来实现,该DIM读取指定输入流并且相应地更新IR。相对于正常解释器模式,该模式默认为定义模式并且将每个名称默认为文字,从而消除对引用的需要(如在前述的示例中)。特殊的句法值可由保留关键字指示,如本领域所公知的。
在该DIM输入模式中,程序可用常规编程语言模型来指定,在常规编程语言模型中名称默认为文字并且结构是可定义的或可声明的。相反,使用更常规的通用解释器方法(其中会需要大量的定义)具有以下缺点:a)引用所有文字元素(诸如如上“Foo”的定义所示的类型名称等)所引起的句法混乱;以及b)与使用以上定义一样不得不指定每个定义结构所引起的关键字混乱。
在一个实施例中,IR中的类型节点被标记为EIT。类似地,声明为其类型是EIT类型的变量被考虑并且被标记为EIV。由此,IR中的类型的EIV是那个结构的变量,而不是特定文字实例。换言之,节点可以是表示类型的类型变量,该类型变量在翻译期间的某一点处被绑定到文字类型,而不是特定文字类型名称。例如,类型NumericType的EIV NType(其中NumericType是EIT)可在翻译期间被绑定到诸如整数、浮点数、双精度或复数之类的文字类型名称。
当DIM遇到结构中的EIV、作为解析某输入的一部分时,它可将该结构的指示写到在调用时向它提供的预定义EIT对象。这个动作调用解释器处理该结构。解释器处理该结构,从而可能对它进行重写并传递给DIM(的新实例)来处理、并且随后更新预定义EIT对象以指示通过调用DIM的后续动作(如果有的话)。
通过遇到EIV所触发的这个回调提供了一种将要由解释器处理的结构有效地嵌入这种编程语言输入的方式,诸如文件蕴含(即,递归导入)和条件翻译。
在一个实施例中,DIM还可在模板模式中调用,在这种情况下,它解析输入流、从而接受未被绑定到特定值的EIT和EIV,并且创建稍后可调用的经解析结构(例如,EIT/EIV模板)的延迟例示内部表示。实际上,这为嵌入式解释器提供了宏能力。
因此,为了调用解释器,DIM的输入形式无需偏离底层语言语法。此外,DIM可用于向解释器提供简明形式的宏能力。而且,IR的EIT/EIV元素可以直接方式用于解释器,只要它们是用于语言本身的相同IR的元素。
EIT规范
在一个实施例中,EIT可在诸如Interp(解释器的命名空间)之类的保留命名空间中指定。例如
Interp::String fileName=″input.tac″;
EIV随后可通过将它指定为该保留命名空间中的这些类型之一用经解析语言表示来定义。在一个实施例中,该命名空间包括与翻译器IR语法中的类型相对应的类型、相关联的迭代器和附属类型、诸如串、整数之类的基本类型,并且还包括专用类型和预定义EIV。例如,在一个实施例中,Interp::translatorIn对应于翻译器的输入流。
这种方法利用了编程语言被指定并实现为语言语法的事实,该编程语言根据与诸如类型或类、过程、变量、表达式等不同语言结构相对应的非终结符号来指定。
被定义为EIT的派生类型的类型也是EIT。它可用附加运算符、属性和特性来定义。在这种情况下,这种派生类型EIT的变量可只被赋予与这些要求相匹配的文字或特定实例值。
该实用工具提供了规定对在模板中出现的EIT和EIV的要求的能力。它提供了通过Java和C#中的类属所提供的能力的超集以及在C++0X中所提出的“概念”机制,而无需特殊的句法和相关联的限制。
关于翻译器可扩展性的现有技术已提出了使内部表示具体化以允许扩展的指定(如用LISP)与使用外部表示作为语法扩展的基础(如用Xoc)之间的分歧。在本方法中,内部表示类型可嵌在外部表示(即,编程语言语法)中,从而实现两种现有技术方法中最好的方法。
解释器结构
在一个实施例中,解释器包括将文本解释输入翻译成内部所谓的字节代码的解析器,该字节代码由字节代码解释器执行。这种字节代码解释器方法采用了本领域公知的技术。它允许从输入的执行中模块化分离语言解析和错误检查以及有效地执行比输入执行更多次的语句,诸如迭代语句(诸如“for”循环)中所指定的那些语句。
在这种解释器结构中,存在用于对变量、常规控制语句的通常操作和用于定义IR中的类型和数据元的字节代码。
优选地,解释器还支持“监听器”对象的定义和例示,这些“监听器”对象响应于指定对象变化来调用。这些指定对象包括EIT实例,这些EIT实例包括预定义EIT。
DIM操作
DIM可操作如下:
a)当遇到包括EIV的语言结构时,该结构被写入EIT对象,使得解释器中的程序被调用。
b)解释器程序执行与该结构相关联的内部代码,从而可能重新调用DIM、并且一旦新调用的DIM到达该输入的末尾就从该执行返回到调用DIM的执行。
在此,解释器访问到目前为止所解析的程序的IR(并且由此访问所有符号)。此外,符号表元素被有效地标记为文字或EIT变量,如之前所述。以下若干章节更详细地讨论了特定功能。
优选地,解析器处理包含EIV而不是调用嵌入式解释器的特定简单结构。例如,使用诸如名称中的?和*之类的通配符字符可由解析器处理,而不是调用嵌入式解释器来评估通配符以提供一系列的匹配。
文件蕴含
文件蕴含可通过语句来处理,该语句指定与翻译器输入流相对应的EIV,例如,
translatorIn<<″filename″(文件名);
在此,translatorIn是与翻译器输入流相对应的预定义EIV。文件还可被指定为EIV,并且随后必须被绑定到此时的特定常量串。它还可以是如上正常命名的常量串。
响应于遇到以上语句,DIM用该结构写入EIT对象,从而调用使解释器访问指定文件并用该输入文件调用DIM的新实例的对应解释器程序,随后等待这个新实例在恢复调用的DIM之前完成。
条件编译/翻译
条件编译可由解释器来处理,该解释器评估“if”语句的测试条件并且随后将“true(真)”部分中的令牌传递给DIM。具体而言,DIM解析“if”语句并且随后在确定测试表达式取决于EIV之后调用嵌入式解释器。解释器确定测试表达式的值并且随后读取输入的令牌,从而传递“true”部分中的那些令牌以供解析并且丢弃其余令牌。在一个实施例中,在这种情况下,DIM有效地将“if cond then(如果条件,则)”推送到解释器堆栈上并且调用解释器。
迭代生成
“for”循环可由解释器处理,该解释器执行for循环、例示指定数量的令牌实例、在贯穿for循环的每个迭代上用其定义来替代与循环变量相对应的EIV变量。在此,for循环使用作为EIV的循环变量或者EIT类型的迭代器对象。
模板定义和例示
通过参数化的类型定义,解释器可调用DIM来定义内部表示中的模板对象。通过参数化的类型例示,解释器可被调用以用其定义来替代每个类型变量。
嵌入式解释运算符
在一个实施例中,基于对自变量类型的确定,每个运算符符号被视为指定嵌入式解释对象,该嵌入式解释对象基于可能只在编译时已知的这些自变量的类型和集体特性而绑定到指定过程。这可被视为常规运算符超载的扩展。例如,考虑具有自变量a和b的运算符f(a,b)。常规运算符超载基于在翻译期间根据如在翻译之前给定的a和b的类型来选择f。在本方法中,可在翻译期间计算a和/或b的类型(即,这些类型本身可以是EIV),并且随后可根据如在翻译期间所计算的a和b的类型来选择f。
扩展处理
在一个实施例中,自动生成各种各样的对象的监听器类型以处理动态探针、纪录、远程访问和其他能力。每个实用工具或扩展被指定为由翻译器解释器执行的解释器程序。实际上,解释器程序在翻译期间监听事件并且被调用以采取行动,诸如响应于新的类型定义来定义对应的(嵌套的)类型。监听器还能够在内部对象模型上迭代,从而生成如特定实用工具所需的附属类型和过程。
通常,需要单独的工具来提供具有附带开销和编程复杂性的每个这样的实用工具。在另一种常规方法中,每个这样的扩展被显式地编码到翻译器程序中。本方法的上述简单性与这些常规替换方法的复杂性形成鲜明对比。
示例
为了更好地理解本方法,考虑以下示例是有帮助的。
假设网络交换机具有通过接口连接到有线链路的一些数量的(numPorts个)端口,有线链路使该网络连接到网络的其余部分。一旦软件被编译,numPorts的值就被固定,但在设计软件时可能是未知的。此外,在一些情况下,使对应于端口的变量名称静态地赋值为“port0”、“port1”等是合乎需要的。同样,通常存在与到控制交换机的CPU(中央处理单元)的连接相对应的区别端口。此外,不同的交换机可具有不同类型的端口,诸如处理以太网协议的那些端口与处理ATM协议的那些端口。同样,在一些情况下,可能想将端口名称前缀“port”(端口)改变成另一个指定,例如“interface”(接口)。
在本发明的一个实施例中,以上可被指定为:
在以上示例中,CpuPort命名预定义类型,该预定义类型采用作为参数的串、整数和指向类型Switch(交换机)的(反向)指针。PortType指定类型Interp::TypeName的EIV,该EIV在翻译中的该点处被绑定到特定类型。Interp::Int和Interp::AttrName分别为整数类型和属性名称类型指定嵌入式解释器类型。numPorts变量是类型Interp::Int的预定义EIV。绑定到文字串“port”的pnp变量是类型Interp::String的预定义EIV。在该示例中,翻译器将诸如上述的输入翻译成如下的C++类中间语言。
当DIM遇到以上“for”语句时,由于其声明为类型Interp::Int即一个EIT,它将循环变量“i”识别为EIV。这种识别使它调用翻译器的嵌入式解释器模块,从而在此问题上提供初始结构的指示以及它在输入源中的位置。
解释器识别“for”循环并且检查相关联的EIV可在此(翻译)时被评估。具体而言,它确定“i”可用其初始值来评估,因为初始值被指定为常量,即值0。它还检查此时numPorts的值是已知的,从而以其他方式生成错误信息。numPorts的值可通过在翻译器被调用时对翻译器的输入、通过类似于在诸如Unix和Linux之类的公共计算机操作系统中提供的所谓环境变量的机制、或者间接地通过其相关于另一个EIV的定义来指定。在该特定示例中,假设numPorts被设为值4。此外,假设PortType EIV绑定到EthPort类型,该EthPort类型处理以太网协议。EIV pnp绑定到串“port”。
解释器随后继续有效地执行该“for”循环。语句
Interp::AttrName attrname=pnp+i;
被识别为定义从EIV pnp中形成的新属性名称,EIV pnp具有与值i级联的文字值“port”。如本领域所公知的,整数值i被转换成为对应的文字串以匹配“+”运算符所需的类型,该“+”运算符此处基于该运算符的第一自变量pnp被解释为串级联运算符,该文字串为字符串。在该循环的初始翻译时执行时,值i为0,由此EIV attrname的值为“port0”。
下一个输入行被识别为其测试条件基于i和numPorts的已知值来评估的“if”语句,从而确定该测试条件是错误的,使它前进到“else”语句。
“else”输入行被解析为其名称由EIV attrname指定的属性的声明,具有参数EIV attrname和i。由此,解释器生成对应的声明,从而用它们对应的值来替代EIV。具体而言,循环的第一迭代上的这一行产生无EIV声明:
EthPort port0(″port0″,0,this);
注意,作为参数的attrname值基于为串类型的端口类型的参数类型自动地被翻译成文字串。
解释器随后识别循环的结束并且继续返回到“for”语句,从而使值i加1、对照numPorts的值测试它、并且随后再次执行循环主体,这次值i为1。循环主体的此后续执行使解释器生成无EIV声明:
EthPort port1(″port1″,1,this);
这个过程重复,i为2并且随后为3。在循环的下一执行中,解释器识别i现在等于numPorts、从而使它执行“if”语句,并且由此生成EIV声明:
CpuPort cpuport(″port4″,4,this);
在循环的后续迭代中,解释器识别到值i不再小于numPorts并且终止循环的执行。它还识别“for”循环的结束对应于被调用来进行处理的语言结构的结束。因此,它重新调用DIM来处理它已生成的结果,该结果是有效的:
在一个实施例中,DIM生成各个输入类型作为C++类以及各个属性声明作为那个类的数据成员。因此,DIM生成C++类类声明:
在此,遵循使数据成员与后缀为“_”字符的属性同名的惯例以区分任何对应的成员功能(诸如在类中声明的“port0()”成员函数)。沿着提供对私有数据成员“port0_”的访问的单个成员函数“port0”的行,″…″所指定的部分指示可以是该类声明的一部分的附加声明。
除了上述以外,DIM生成用于交换机类的C++结构函数,该C++结构函数用对应类的实例来初始化这些数据成员,如下:
如该示例中所示的,可基于只改变numPorts的定义,使所生成的软件适应翻译时所需的端口数量而无需改变输入源。它还可处理通过在翻译时改变绑定到PortType的值来简单地生成具有不同的端口类型的属性。端口名称前缀还可通过将pnp的定义改变成另一个串来改变,例如,
Interp::String pnp=″intf″;
因为EIV和EIT是输入语法的一部分,所以翻译器能够执行正常的句法检查并且提供信息错误检查。例如,如果因为程序员偶然在文字串“port”的开头插入“.”所以输入源指定
Interp::String pnp=″.port″;
并且如果不允许该字符作为合法属性名称的一部分,则嵌入式解释器可在它遇到以下时发出特别指示所生成的“port”名称不是合法属性名称的出错信息:
Interp::AttrName attrname=pnp+i;该示例还示出了本方法可减小需要被指定的输入源的量,即使当numPorts不变时。相应地,它允许程序员在输入源中指示其扩展形式不那么明显的重复结构中的规律性。此外,如果属性被指示为要静态地定义,则扩展版本还可通过生成扩展静态形式来允许降低执行时的开销,从而消除了对其运行时生成的需要。
最后,以上示例可被变换成模板,从而通过用EIV参数限定声明来允许具有指定参数的延迟例示。例如,该示例可被模板化为:
“SwitchTemplate”之后的括号内的EIV PortType、numPorts和pnp指示这是具有这些EIV作为参数的参数化类型声明。由此,当DIM遇到该类型声明时,这些EIV声明的出现使它调用解释器,该解释器识别还未绑定的这些EIV声明并且延迟例示。具有特定参数的这种类型的后续声明使特定类型被例示。例如,声明:
Interp::Type pt=isEtherSwitch?EthPort:AtmPort;
Interp::Int ports=3;
SwitchTemplate(pt,ports,″port″)switch;
可使类型的例示与在该示例的开始所指定的交换机类型相当,假设EIVisEtherSwitch为真、数据元称为该类型的“switch”。可与上述一样来实现这种例示的交换机类型,不同之处在于作为该例示的一部分的三个EIV可绑定到调用它的自变量“pt”、“ports”和“port”。
与在思考之后被添加到语言的宏处理器或C++模板实用工具所提供的替换能力不同,这种能力使用语言的现有句法,从而依赖于EIT的类型标签化来区分翻译时评估和运行时评估。此外,作为语言中的正确类型,可传递诸如“port”之类的串以及表达式并具有准确的类型检查,并且可施加转换。例如,上述可被重新写入以传递表达式,从而如下地消除EIV pt:
SwitchTemplate(isEtherSwitch?EthPort:AtmPort,ports,″port″)switch;
假设“isEtherSwitch”是一EIV。
如该示例示出地,在本方法中,通过使用嵌入式解释类型和它们相关联的变量、调用解释器以在翻译时执行这些细节,编程语言的正常语法和强大结构可在翻译时用来修改、限定和扩展所生成的软件。
前面的描述集中在根据本发明实施例的方法上。本发明的实施例还包括被编程以自动地执行相关方法的计算机装置(即,系统)和包含执行相关方法的软件指令的计算机可读介质。这些计算机装置可用硬件和/或软件的任意组合来提供。计算机可读介质包括诸如磁和光介质之类的大容量存储介质,并且可以是本地的(即,直接连接到计算机)或远程的(即,通过一个或多个网络连接到计算机)。

Claims (8)

1.一种用于将计算机程序自动翻译成计算机可执行形式的方法,所述方法包括:
提供用输入计算机语言表达的输入计算机程序,其中所述输入计算机语言包括在运行时要评估的语言元素或结构的第一数据类型集合、以及在翻译时要评估的语言元素或结构的第二数据类型集合,并且其中所述输入计算机程序包括具有所述第一数据类型集合中的类型的至少一个元素或结构并且包括具有所述第二数据类型集合中的类型的至少一个元素或结构;
将所述输入计算机程序自动翻译成计算机可执行输出表示,其中在所述自动翻译期间评估具有所述第二数据类型集合中的类型的至少一个元素或结构;以及
提供所述计算机可执行输出表示作为输出,
其中,根据语言元素或结构的数据类型来确定在翻译时对所述语言元素或结构的评估以及在运行时对所述语言元素或结构的评估,将所述输入计算机程序自动翻译成计算机可执行输出表示包括将所述输入计算机程序翻译成中间表示,并且其中所述中间表示只包括在运行时要评估的结构,以及其中
运算符的翻译时评估包括:
确定向所述运算符提供的自变量类型,其中至少一种所述自变量类型在所述自动翻译期间被评估为类型值;
提供具有与所确定的自变量类型相一致的输入自变量类型的所述运算符的版本。
2.如权利要求1所述的方法,其特征在于,所述输入计算机语言具有预定和固定的语法,并且其中语言结构的语义含义不取决于所述语言结构是具有所述第一数据类型集合还是第二数据类型集合中的类型。
3.如权利要求1所述的方法,其特征在于,在翻译期间通过包括在编译器中的嵌入式解释器来评估具有所述第二数据类型集合中的类型的至少一个元素或结构。
4.如权利要求3所述的方法,其特征在于,所述编译器包括将其输入流中的每个名称默认地作为文字处理的定义输入模块,并且其中所述定义输入模块在翻译具有所述第二数据类型集合中的类型的结构期间调用所述嵌入式解释器。
5.如权利要求4所述的方法,其特征在于,所述嵌入式解释器和定义输入模块可彼此递归地调用。
6.如权利要求1所述的方法,其特征在于,所述输入计算机程序包括具有所述第二数据类型集合中的类型的所述输入计算机语言的一个或多个结构,所述结构在翻译期间提供相应数据元或结构的延迟例示。
7.如权利要求1所述的方法,其特征在于,具有所述第二数据类型集合中的类型的至少一个元素或结构包括从“if-then”、“if-then-else”、“for”、“do-while”和“switch-case”组成的组中选择的控制结构。
8.一种用于将计算机程序自动翻译成计算机可执行形式的系统,所述系统包括:
第一装置,用于提供用输入计算机语言表达的输入计算机程序,其中所述输入计算机语言包括在运行时要评估的语言元素或结构的第一数据类型集合、以及在翻译时要评估的语言元素或结构的第二数据类型集合,并且其中所述输入计算机程序包括具有所述第一数据类型集合中的类型的至少一个元素或结构并且包括具有所述第二数据类型集合中的类型的至少一个元素或结构;
第二装置,用于将所述输入计算机程序自动翻译成计算机可执行输出表示,其中在所述自动翻译期间评估具有所述第二数据类型集合中的类型的至少一个元素或结构;以及
第三装置,用于提供所述计算机可执行输出表示作为输出,
其中,根据语言元素或结构的数据类型来确定在翻译时对所述语言元素或结构的评估以及在运行时对所述语言元素或结构的评估,将所述输入计算机程序自动翻译成计算机可执行输出表示包括将所述输入计算机程序翻译成中间表示,并且其中所述中间表示只包括在运行时要评估的结构,以及其中
运算符的翻译时评估包括:
确定向所述运算符提供的自变量类型,其中至少一种所述自变量类型在所述自动翻译期间被评估为类型值;
提供具有与所确定的自变量类型相一致的输入自变量类型的所述运算符的版本。
CN201080015827.XA 2009-03-27 2010-03-26 使用嵌入式解释器类型和变量的基于解释器的程序语言翻译器 Active CN102365621B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12/383,732 2009-03-27
US12/383,732 US8799877B2 (en) 2009-03-27 2009-03-27 Interpreter-based program language translator using embedded interpreter types and variables
PCT/US2010/000929 WO2010110925A2 (en) 2009-03-27 2010-03-26 Interpreter-based program language translator using embedded interpreter types and variables

Publications (2)

Publication Number Publication Date
CN102365621A CN102365621A (zh) 2012-02-29
CN102365621B true CN102365621B (zh) 2015-08-26

Family

ID=42781725

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201080015827.XA Active CN102365621B (zh) 2009-03-27 2010-03-26 使用嵌入式解释器类型和变量的基于解释器的程序语言翻译器

Country Status (3)

Country Link
US (2) US8799877B2 (zh)
CN (1) CN102365621B (zh)
WO (1) WO2010110925A2 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2578979A1 (en) * 2007-02-19 2008-08-19 Cognos Incorporated System and method of report representation
CA2578980A1 (en) 2007-02-19 2008-08-19 Cognos Incorporated System and method of report rendering
US8660836B2 (en) 2011-03-28 2014-02-25 International Business Machines Corporation Optimization of natural language processing system based on conditional output quality at risk
CN102495766A (zh) * 2011-11-30 2012-06-13 清华大学 设备规范与设备行为的一致性检测系统
EP2602678B1 (de) * 2011-12-07 2014-08-13 Siemens Aktiengesellschaft Verfahren zum Übersetzen eines in einer Automatisierungssprache vorliegenden Steuerungsprogramms in eine Zwischensprache
US9069902B2 (en) 2012-10-12 2015-06-30 Vmware, Inc. Software test automation
US8949794B2 (en) * 2012-10-12 2015-02-03 Vmware, Inc. Binding a software item to a plain english control name
US10067858B2 (en) 2012-10-12 2018-09-04 Vmware, Inc. Cloud-based software testing
US9292422B2 (en) 2012-10-12 2016-03-22 Vmware, Inc. Scheduled software item testing
US10387294B2 (en) 2012-10-12 2019-08-20 Vmware, Inc. Altering a test
US9684587B2 (en) 2012-10-12 2017-06-20 Vmware, Inc. Test creation with execution
US9292416B2 (en) 2012-10-12 2016-03-22 Vmware, Inc. Software development kit testing
US20140372993A1 (en) * 2013-06-14 2014-12-18 Microsoft Corporation Overloading on constants
JP6428936B2 (ja) * 2015-06-10 2018-11-28 富士通株式会社 情報処理装置、情報処理方法および情報処理プログラム
US10019244B1 (en) * 2016-09-28 2018-07-10 Amazon Technologies, Inc. Interpreting program code using a symbol table
US10169020B2 (en) 2017-02-01 2019-01-01 International Business Machines Corporation Software globalization of distributed packages
US11106435B1 (en) * 2020-02-13 2021-08-31 Yokogawa Electric Corporation OPC UA server, system operating using OPC UA, and method of executing OPC UA system
CN115543852A (zh) * 2022-11-10 2022-12-30 凯云联创(北京)科技有限公司 一种嵌入式系统自动测试方法
CN116319487B (zh) * 2023-03-24 2023-09-29 广州市易鸿智能装备有限公司 一种工业协议动态解析方法及系统

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101336413A (zh) * 2006-01-25 2008-12-31 微软公司 编译时可解释代码检错

Family Cites Families (48)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5864862A (en) * 1996-09-30 1999-01-26 Telefonaktiebolaget Lm Ericsson (Publ) System and method for creating reusable components in an object-oriented programming environment
US6314562B1 (en) * 1997-09-12 2001-11-06 Microsoft Corporation Method and system for anticipatory optimization of computer programs
US6138269A (en) * 1998-05-20 2000-10-24 Sun Microsystems, Inc. Determining the actual class of an object at run time
US6108659A (en) * 1998-12-22 2000-08-22 Computer Associates Think, Inc. Method and apparatus for executing stored code objects in a database
JP4118456B2 (ja) * 1999-06-29 2008-07-16 株式会社東芝 プログラム言語処理システム、コード最適化方法、及び機械読み出し可能な記憶媒体
GB2358261B (en) * 2000-01-17 2004-06-09 Advanced Risc Mach Ltd Data processing with native and interpreted program instruction words
JP4662657B2 (ja) * 2000-07-10 2011-03-30 マイクロソフト コーポレーション 統一データ型システムおよび方法
US6760905B1 (en) * 2000-09-21 2004-07-06 Curl Corporation Lazy compilation of template-generated classes in dynamic compilation execution environments
US6993751B2 (en) * 2001-05-14 2006-01-31 Microsoft Corporation Placing exception throwing instructions in compiled code
US7350194B1 (en) * 2001-09-24 2008-03-25 Oracle Corporation Techniques for debugging computer programs involving multiple computing machines
US20030066056A1 (en) * 2001-09-28 2003-04-03 Petersen Paul M. Method and apparatus for accessing thread-privatized global storage objects
US7278137B1 (en) * 2001-12-26 2007-10-02 Arc International Methods and apparatus for compiling instructions for a data processor
US7240331B2 (en) * 2002-01-16 2007-07-03 Xerox Corporation Bi-valuation of programming statements
US7369984B2 (en) * 2002-02-01 2008-05-06 John Fairweather Platform-independent real-time interface translation by token mapping without modification of application code
US6973644B2 (en) * 2002-04-12 2005-12-06 The Mathworks, Inc. Program interpreter
US20040006765A1 (en) * 2002-04-16 2004-01-08 Goldman Kenneth J. Live software construction with dynamic classes
US7350198B2 (en) * 2003-09-09 2008-03-25 Sap Aktiengesellschaft Creating and checking runtime data types
US20050216896A1 (en) * 2004-03-26 2005-09-29 Santera Systems, Inc. Data communication via tanslation map exchange
US7761858B2 (en) * 2004-04-23 2010-07-20 Microsoft Corporation Semantic programming language
US20060048095A1 (en) * 2004-08-31 2006-03-02 Microsoft Corporation Local type alias inference system and method
US7451436B2 (en) * 2004-11-23 2008-11-11 National Instruments Corporation Aggregate handling of operator overloading
US7793273B2 (en) * 2004-11-23 2010-09-07 National Instruments Corporation Type propagation for automatic casting of output types in a data flow program
DE102004057490B4 (de) * 2004-11-29 2007-02-22 Infineon Technologies Ag Vorrichtung und Verfahren zum Verarbeiten eines Programmcodes
US20060130038A1 (en) * 2004-12-15 2006-06-15 Claussen Christopher S Apparatus, system, and method for facilitating dynamic modification of existing software objects defined in a strongly-typed programming language
US20060212847A1 (en) * 2005-03-18 2006-09-21 Microsoft Corporation Type checker for a typed intermediate representation of object-oriented languages
US7992140B2 (en) * 2005-07-29 2011-08-02 Microsoft Corporation Compiler supporting programs as data objects
US7945904B2 (en) * 2005-08-22 2011-05-17 Microsoft Corporation Embedding expression in XML literals
US20070074185A1 (en) * 2005-08-30 2007-03-29 Microsoft Corporation Identifier expressions
US8079037B2 (en) * 2005-10-11 2011-12-13 Knoa Software, Inc. Generic, multi-instance method and GUI detection system for tracking and monitoring computer applications
US7774746B2 (en) * 2006-04-19 2010-08-10 Apple, Inc. Generating a format translator
US8225294B2 (en) * 2006-04-27 2012-07-17 Oracle America, Inc. Method and apparatus for expressing and checking relationships between types
US7954059B2 (en) * 2006-07-24 2011-05-31 National Instruments Corporation Automatic conversion of text-based code having function overloading and dynamic types into a graphical program for compiled execution
US20080033968A1 (en) * 2006-08-07 2008-02-07 Quan Dennis A Methods and apparatus for input specialization
US8739137B2 (en) * 2006-10-19 2014-05-27 Purdue Research Foundation Automatic derivative method for a computer programming language
US8490051B2 (en) * 2007-02-28 2013-07-16 Microsoft Corporation Generic interface for numeric types
US20080247532A1 (en) * 2007-04-06 2008-10-09 Waldean Allen Schulz Method and System for Representing Quantitative Properties in a Computer Program and for Validating Dimensional Integrity of Mathematical Expressions
US8255883B2 (en) * 2007-04-20 2012-08-28 Microsoft Corporation Translating late bound LINQ expressions into database queries
US8042099B2 (en) * 2007-05-30 2011-10-18 Red Hat, Inc. Facilitating availability of object data types at runtime
US8321836B2 (en) * 2007-06-21 2012-11-27 Microsoft Corporation Late bound programmatic assistance
US20080320453A1 (en) * 2007-06-21 2008-12-25 Microsoft Corporation Type inference and late binding
US8996433B2 (en) * 2007-10-11 2015-03-31 Steven Ginzberg Automated natural language formula translator and data evaluator
US8127282B2 (en) * 2007-11-02 2012-02-28 International Business Machines Corporation Recompilation of a class with a java static variable
US8189004B2 (en) * 2007-11-09 2012-05-29 Lucasfilm Entertainment Company Ltd. Translating Renderman shading language code
US20090228874A1 (en) * 2008-03-07 2009-09-10 Interuniversitair Microelektronica Centrum Vzw (Imec) Method and system for code compilation
US9170787B2 (en) * 2008-06-27 2015-10-27 Microsoft Technology Licensing, Llc Componentization of compiler functionality
US20100077384A1 (en) * 2008-09-23 2010-03-25 Microsoft Corporation Parallel processing of an expression
US20100153912A1 (en) * 2008-12-15 2010-06-17 Apple Inc. Variable type knowledge based call specialization
US8813043B2 (en) * 2008-12-31 2014-08-19 Microsoft Corporation Unifying type checking and property checking for low level programs

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101336413A (zh) * 2006-01-25 2008-12-31 微软公司 编译时可解释代码检错

Also Published As

Publication number Publication date
US8799877B2 (en) 2014-08-05
US20100251224A1 (en) 2010-09-30
WO2010110925A2 (en) 2010-09-30
US20150012912A1 (en) 2015-01-08
CN102365621A (zh) 2012-02-29
WO2010110925A3 (en) 2011-01-13
US9262135B2 (en) 2016-02-16

Similar Documents

Publication Publication Date Title
CN102365621B (zh) 使用嵌入式解释器类型和变量的基于解释器的程序语言翻译器
CN109375899B (zh) 一种形式验证Solidity智能合约的方法
Leroy A formally verified compiler back-end
Czarnecki et al. DSL implementation in MetaOCaml, Template Haskell, and C++
US9952841B2 (en) Programming system and language for application development
KR101150003B1 (ko) 소프트웨어 개발 툴 생성 방법
Nystrom et al. J& nested intersection for scalable software composition
US20070050168A1 (en) Type extensions
Schröer The GENTLE Compiler Construction System
Vick et al. The microsoft visual basic language specification
Ben-Ari Compile and runtime errors in java
Balland et al. Tom Manual
Legros et al. Generic and reflective graph transformations for checking and enforcement of modeling guidelines
Tuong et al. Isabelle/C
Quinlan et al. Rose user manual: A tool for building source-to-source translators draft user manual (version 0.9. 11.115)
EP1785848A1 (en) Method and apparatus for semantic checking of program code
Tang et al. Axioms as generic rewrite rules in C++ with concepts
Pirkelbauer Programming language evolution and source code rejuvenation
Tsai Code generation for the IOA language
Miranti Semantics of low-level languages
Lukeš API for C# code generation
Morales et al. Modular Extensions for Modular (Logic) Languages
Liu et al. Type-specialized staged programming with process separation
Fegaras CSE 5317/4305: Design and Construction of Compilers
Sharan et al. Writing Java Programs

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant